数据集概述
本数据集包含全球人口统计数据,涵盖1950年至2023年间300个国家、地区及子区域的人口相关指标。数据来源于全球人口统计数据库,通过Pandas全量分析,包含21,983条记录,覆盖人口总量、性别比例、出生率、死亡率、预期寿命、移民数据等关键人口统计指标。数据集以CSV格式存储,文件大小为8.1MB,包含65个字段,时间跨度为73年,适合分析全球人口趋势及区域差异。
数据内容
数据集包含21,983条记录,覆盖300个国家、地区及子区域,时间范围从1950年到2023年。数据按年度记录,每条记录代表特定地区在某一年的人口统计信息。主要统计指标包括总人口、性别分布、人口密度、出生与死亡率、预期寿命、移民数量等。数据涵盖9种区域类型(如国家/地区、子区域、可持续发展目标区域等),涉及125至166个国家的客户记录。缺失率整体较低,约为1.85%,主要集中在“Notes”字段(缺失率74.4%)。
字段定义
数据集包含以下核心字段类别:
- 标识信息:索引编号(Index)、区域/国家名称(Region, subregion, country or area )、位置代码(Location code)、ISO3字母代码(ISO3 Alpha-code)、ISO2字母代码(ISO2 Alpha-code)、SDMX代码(SDMX code*)、区域类型(Type)、父级代码(Parent code)
- 时间信息:年份(Year),范围从1950年至2023年
- 人口总量:1月1日总人口(千)(Total Population, as of 1 January (thousands))、7月1日总人口(千)(Total Population, as of 1 July (thousands))、7月1日男性人口(千)(Male Population, as of 1 July (thousands))、7月1日女性人口(千)(Female Population, as of 1 July (thousands))
- 人口密度与性别比例:7月1日人口密度(每平方公里人数)(Population Density, as of 1 July (persons per square km))、7月1日性别比例(每100女性对应男性数)(Population Sex Ratio, as of 1 July (males per 100 females))
- 年龄结构:7月1日人口中位年龄(年)(Median Age, as of 1 July (years))、平均生育年龄(年)(Mean Age Childbearing (years))
- 出生相关指标:出生人数(千)(Births (thousands))、15至19岁女性生育数(千)(Births by women aged 15 to 19 (thousands))、粗出生率(每千人出生数)(Crude Birth Rate (births per 1,000 population))、总和生育率(每女性活产数)(Total Fertility Rate (live births per woman))、净生殖率(每女性存活女儿数)(Net Reproduction Rate (surviving daughters per woman))、出生性别比例(每100女性出生对应男性数)(Sex Ratio at Birth (males per 100 female births))
- 死亡相关指标:总死亡人数(千)(Total Deaths (thousands))、男性死亡人数(千)(Male Deaths (thousands))、女性死亡人数(千)(Female Deaths (thousands))、粗死亡率(每千人死亡数)(Crude Death Rate (deaths per 1,000 population))、婴儿死亡人数(千)(Infant Deaths, under age 1 (thousands))、婴儿死亡率(每千活产婴儿死亡数)(Infant Mortality Rate (infant deaths per 1,000 live births))、五岁以下死亡人数(千)(Under-Five Deaths, under age 5 (thousands))、五岁以下死亡率(每千活产五岁以下死亡数)(Under-Five Mortality (deaths under age 5 per 1,000 live births))
- 预期寿命:出生时预期寿命(两性、男性、女性)(Life Expectancy at Birth, both sexes/male/female (years))、15岁时预期寿命(两性、男性、女性)(Life Expectancy at Age 15, both sexes/male/female (years))、65岁时预期寿命(两性、男性、女性)(Life Expectancy at Age 65, both sexes/male/female (years))、80岁时预期寿命(两性、男性、女性)(Life Expectancy at Age 80, both sexes/male/female (years))
- 人口变化与移民:自然增长(出生减死亡,千)(Natural Change, Births minus Deaths (thousands))、自然增长率(每千人)(Rate of Natural Change (per 1,000 population))、人口变化(千)(Population Change (thousands))、人口增长率(百分比)(Population Growth Rate (percentage))、人口年翻倍时间(年)(Population Annual Doubling Time (years))、净移民数(千)(Net Number of Migrants (thousands))、净移民率(每千人)(Net Migration Rate (per 1,000 population))
- 死亡年龄分布:40岁前死亡率(每千活产)(Mortality before Age 40, both sexes/male/female)、60岁前死亡率(每千活产)(Mortality before Age 60, both sexes/male/female)、15至50岁死亡率(每千15岁存活者)(Mortality between Age 15 and 50, both sexes/male/female)、15至60岁死亡率(每千15岁存活者)(Mortality before Age 60, both sexes/male/female)
- 其他:备注(Notes)、存活至1岁活产数(千)(Live Births Surviving to Age 1 (thousands))
数据特征
数据集覆盖300个国家、地区及子区域,时间跨度从1950年至2023年,记录了73年的全球人口动态。人口总量数据范围广泛,从小型地区(如直布罗陀,约25千)到大型国家(如印度,超10亿)。人口密度差异显著,范围从0.0至26145.3人/平方公里,平均值为258.5人/平方公里。性别比例平均为100.057(每100女性对应男性数),出生性别比例以105和106为主,分别占23.52%和21.74%。出生率和死亡率数据完整,粗出生率均值为28.788(每千人),粗死亡率均值为11.188(每千人)。预期寿命数据反映全球健康水平差异,出生时预期寿命范围从11.0年至86.4年,均值为63.525年。婴儿死亡率和五岁以下死亡率显示显著区域差异,分别从0.7至423.8(均值57.899)和1.0至689.0(均值87.04)。净移民率范围从-709.9至357.1(每千人),反映人口流动的多样性。数据完整性较高,总体缺失率仅为1.85%,但“Notes”字段缺失率较高(74.4%),因其为可选字段,符合数据逻辑。
适用场景
本数据集适用于以下分析与应用场景:
- 人口趋势分析:研究全球及区域人口增长、老龄化及性别比例变化
- 公共健康研究:分析预期寿命、婴儿死亡率及五岁以下死亡率的空间与时间差异
- 生育与死亡模式研究:评估总和生育率、粗出生率及死亡率的变化趋势
- 移民流动分析:研究全球移民模式及其对人口结构的影响
- 政策制定支持:为人口规划、医疗资源分配及移民政策提供数据支持
- 跨国比较分析:对比不同国家和地区的人口特征及发展水平
- 时间序列建模:基于历史数据预测人口增长、老龄化或移民趋势
- 教学与学术研究:用于人口学、统计学及数据科学课程的案例分析
数据来源
联合国经济和社会事务部人口司