数据集名称:
基于集成学习和地理空间大数据的中国第七次人口普查百米网格化人口数据集(2020年)
数据简介:
本数据集通过堆叠集成学习方法结合地理空间大数据,生成了中国2020年第七次全国人口普查的百米网格化人口分布数据。数据覆盖全国范围,空间分辨率为100米,可用于高精度的人口空间分布研究和各类地理、经济、社会分析应用。
数据来源:
中国第七次全国人口普查(2020年)县级与乡镇级统计数据
地理空间大数据及10类协变量(如夜间灯光、土地利用、道路密度、海拔等)
模型训练与预测基于随机森林、XGBoost、LightGBM三种算法构建的堆叠集成学习模型
数据格式:
GeoTIFF 栅格数据文件,分辨率为100米,单位为人口数量。每个像元表示其对应地理位置内的人口估计值。
时间范围:
2020年
空间范围:
中国大陆地区,覆盖全国所有省级行政区域
字段说明:
经纬度(隐含于栅格数据坐标系中)
人口数量:每个百米网格内的人口估计值(单位:人)
数据特征:
高空间分辨率(100米)的人口估计
基于多源协变量和集成机器学习的建模方法
与乡镇级人口普查数据进行精度验证,结果显示R²值为0.8936,高于现有主流产品(WorldPop和LandScan)
适用场景:
城市规划与土地利用分析
灾害应急响应与人口暴露评估
公共服务设施布局优化
环境影响评估与可持续发展研究
大规模社会经济建模与模拟
更新频率:
静态数据集,反映2020年人口分布状况,暂无更新计划
数据量:
126.04 MB