电极利亚城市用电预测数据集2016-2020
数据来源:互联网公开数据
标签:电力预测,城市用电,天气影响,时间序列,数据科学竞赛,预测模型,小时级数据
数据概述:
本数据集包含了2016年至2020年间电极利亚城市每小时的电力消费记录,共计五年时间。数据集包含多个影响电力消费的关键变量,包括温度、气压、风速以及两个匿名化特征(var1和var2)。这些数据用于研究和预测电极利亚的电力需求,帮助电极利亚公司优化其电力生产计划。
数据用途概述:
该数据集适用于电力需求预测、天气影响分析、时间序列建模等场景。研究人员和数据科学家可以通过该数据集开发预测模型,帮助电极利亚公司根据历史数据预测未来电力需求,从而更好地安排生产。此外,该数据集也适用于学术研究,研究天气和其他因素对电力消费的影响。
举例:
数据集包括以下关键字段:
- ID:每条记录的唯一标识符
- datetime:记录的时间戳
- temperature:记录时间的气温
- var1:匿名特征变量1
- pressure:记录时间的气压
- windspeed:记录时间的风速
- var2:匿名特征变量2
- electricity_consumption:目标变量,表示该小时的电力消耗量(以兆瓦时MWh为单位)
在数据集的竞赛任务中,训练集包含每个月的前23天数据,而测试集则包含每个月的第24天到月底的数据。评估模型性能时,公共排行榜将基于测试集的前两天,而私有排行榜则基于剩余的测试数据。预测的目标是在不使用未来数据的情况下,准确预测每小时的电力消耗量。