美国洛杉矶交通流量与天气日历数据集2020年2月1日-5月31日
数据来源:互联网公开数据
标签:交通流量,天气数据,日历特征,机器学习,城市交通,预测分析,交通工程
数据概述:
本数据集用于研究论文《利用机器学习和Twitter信息预测城市交通流量》(详见https://ieeexplore.ieee.org/document/10185516),涵盖了2020年2月1日至5月31日期间美国洛杉矶Ventura高速公路东向车道的交通数据,包括车速和流量信息。日历特征包括从1到7编号的星期几及表示是否为节假日的二元变量。天气数据来自Wunderground网站(https://www.wunderground.com/history/daily/KLAX),其中包括每小时的多种气象因素观测。假设每小时内的5分钟时间间隔内天气条件保持不变。
数据用途概述:
该数据集适用于城市交通流量预测、交通工程分析、机器学习模型训练及评估等场景。研究人员可以通过此数据集进行交通流量与天气条件之间的关系研究;城市规划部门可以基于数据优化交通管理和资源配置;交通工程人员可利用数据进行交通模式分析;学者及学生则可以借此学习城市交通系统分析的相关技术。
举例:
数据集包含的具体内容如下:
- 交通流量数据:涵盖车速和流量等指标,时间为2020年2月1日至5月31日,洛杉矶Ventura高速公路东向车道。
- 日历特征:包括从1到7编号的星期几及是否为节假日的二元变量。
- 天气数据:包括每小时的气象因素观测,如天气状况(晴天、扬沙、多云、雾等)、温度(华氏度)等。
- 数据处理:对于因传感器故障或数据噪音导致的临时数据缺失,采用均值插补法进行处理。