美国各县市居民通勤方式普查数据集-2011-2019年-goswamisagard
数据来源:互联网公开数据
标签:通勤方式,人口普查,美国,交通,县市,普查数据,社会经济,数据分析
数据概述:
本数据集基于美国人口普查局的美国社区调查(ACS)1年期和5年期调查数据,涵盖了2011年至2019年间美国各县市居民的通勤方式信息。数据通过API获取,并经过清洗和整理,以方便用户使用。原始数据包括各种通勤方式的估计值、误差范围和注释。
数据获取与清洗过程:
数据通过Python的requests库从美国人口普查局API获取,API链接为:https://api.census.gov/data/2011/acs/acs1?get=group(B08301)&for=county:*,获取的数据为JSON格式。数据导入Pandas DataFrame后,进行了以下清洗步骤:
1. 移除了不必要的变量。
2. 重命名了列名,使用网络爬虫获取变量名称,替换原始代码。
3. 处理了2011-2019年多个ACS/ACS-1数据集,并将它们合并成一个Pandas DataFrame。
4. 重新排列了列的顺序,并将“NAME”列拆分为“StateName”和“CountyName”两列。
5. 移除了缺失数据的县市。
6. 将DataFrame拆分为两个新的DataFrame,分别用于存储州和县市的数据,并导出为.csv格式。
数据用途概述:
该数据集适用于分析美国居民的通勤行为,研究交通运输与社会经济之间的关系,以及进行城市规划等。具体应用包括:
* 分析不同地区通勤方式的差异。
* 研究通勤方式与收入、教育程度等社会经济因素的关系。
* 为交通基础设施建设和公共交通政策制定提供数据支持。
* 进行城市交通流量预测和分析。