零售商品销售预测特征工程数据集RetailProductSalesForecastingFeatureEngineeringDataset-sleymanemirhanuslu
数据来源:互联网公开数据
标签:时间序列预测, 零售数据, 商品销售, 特征工程, 机器学习, 时序分析, 数据挖掘, 预测模型
数据概述:
该数据集包含来自M5竞赛的数据,记录了零售商品销售预测过程中生成的特征工程数据。主要特征如下:
时间跨度:数据未明确标明具体时间,但从特征名称推测,数据与时间序列相关,可能用于预测未来销售额。
地理范围:数据未明确标明具体地理范围,但从数据集的组织结构来看,可能涵盖了多个商店和商品类别。
数据维度:数据集包含多种特征,包括基于时间序列分解的特征(如autoARIMA预测值),基于统计特征提取的特征(如catch22特征),以及基于tsfresh库生成的特征。主要数据项包括销售额(y),以及各种用于预测销售额的衍生特征。
数据格式:数据以CSV和JSON格式提供,CSV文件包含结构化的特征数据,便于分析和建模。
来源信息:数据来源于M5竞赛(一个公开的零售销售预测比赛),数据经过特征工程处理,用于构建预测模型。
该数据集适合用于时间序列预测、特征工程方法研究和机器学习模型的构建与评估。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于时间序列分析、特征工程方法比较和零售销售预测领域的学术研究,如不同特征对预测结果的影响研究。
行业应用:可以为零售行业提供数据支持,尤其适用于销售预测、库存管理、促销策略优化等方面。
决策支持:支持零售企业制定更精准的销售计划、优化供应链管理和提升盈利能力。
教育和培训:作为时间序列预测、特征工程和机器学习课程的实训材料,帮助学生和研究人员深入理解预测模型的构建过程和特征选择方法。
此数据集特别适合用于探索不同特征对销售预测精度的影响,帮助用户提升预测模型的性能,优化零售业务决策。