伊斯兰堡空气质量监测数据集-2019至2023年-diraf0
数据来源:互联网公开数据
标签:空气质量,伊斯兰堡,巴基斯坦,环境监测,SO2,NO2,PM2.5,温度,湿度
数据概述:
本数据集收录了巴基斯坦伊斯兰堡自2019年6月至2023年3月的空气质量监测数据。数据源自巴基斯坦环境和保护局(EPA)官方网站,最初以PDF格式发布,部分文件包含表格数据,部分文件则为数据表格的图像。对于包含图像的文件,使用Google Cloud Vision API进行OCR处理,进行数据清洗后导出;对于包含表格的文件,则使用tabula-py和PyPDF2库读取,清洗后导出。数据集尽可能保持完整性和准确性,用户可自行访问EPA官网进行验证。
数据集包含以下关键指标:
- 温度(单位:摄氏度)
- 湿度(单位:百分比)
- 二氧化硫(SO2)浓度(单位:微克/立方米)
- 二氧化氮(NO2)浓度(单位:微克/立方米)
- 细颗粒物(PM2.5)浓度(单位:微克/立方米)
数据集还包含一个名为“final_data.csv”的合并文件,该文件整合了所有观测数据,并新增了“Year”列以便按年份区分观测记录。
数据用途概述:
该数据集适用于环境监测、空气质量研究、健康风险评估、城市规划等多种场景。研究人员可以利用此数据评估伊斯兰堡空气质量随时间的变化趋势;环保机构可借助数据制定污染控制政策;公众和相关组织可基于数据了解所在环境的空气质量状况,采取相应措施保护健康。由于数据集公开发布在EPA官方网站,且未发现特定的使用许可限制,因此任何人均可使用该数据进行分析。