时间序列预测流行基准数据集
数据来源:互联网公开数据
标签:时间序列,预测分析,基准数据,流行数据集,行业应用,算法评估,数据分析
数据概述:
本数据集包含多个流行的时间序列预测基准数据集,涵盖了交通、电力、COVID-19、汇率、天气和ETT等多种领域的时间序列数据。每个数据集均经过标准化处理,适合用于时间序列预测模型的训练、验证和测试。数据集的时间范围和样本间隔各不相同,具体如下:
- 交通:包含旧金山963条 freeway 车道的小时交通数据,适用于短期预测;862条车道的小时交通数据,适用于长期预测。数据自2015年1月1日起收集,样本间隔为每小时一次。
- 电力:包含370名用户的短期用电量数据和321名用户的长期用电量数据。数据自2011年1月1日起收集,样本间隔为每15分钟一次。
- COVID-19:包含美国加利福尼亚州2020年1月2日至2020年12月31日的COVID-19住院数据,样本间隔为每天一次。
- 汇率:包含8个国家(澳大利亚、英国、加拿大、瑞士、中国、日本、新西兰和新加坡)自1990年至2016年的每日汇率数据,样本间隔为每天一次。
- 天气:包含德国马克斯普朗克生物地球化学研究所气象站2020年的21个气象指标(如湿度和气温)数据,样本间隔为每10分钟一次。
- ETT:包含来自两个不同电力变压器的数据,每个变压器具有两种分辨率(15分钟和1小时),分别标记为m和h。
数据用途概述:
该数据集适用于时间序列预测算法的开发、评估和基准测试。研究人员和开发者可以利用这些数据集验证模型的预测性能,比较不同算法的优劣。数据集还适用于时间序列分析、模式识别、趋势预测和异常检测等场景。此外,该数据集可作为教学和培训资源,帮助学习者理解时间序列预测的基本原理和实际应用。