Everlytics数据集转换任务-商品销售数据-时间聚合与标签拆分-sauhardsaini

Everlytics数据集转换任务-商品销售数据-时间聚合与标签拆分-sauhardsaini 数据来源:互联网公开数据 标签:商品销售,时间序列,数据聚合,标签拆分,Python,数据清洗,CSV,转换任务

数据概述: 本数据集是对商品销售数据进行处理后的结果。原始数据来源于CSV文件,记录了商品销售的详细信息,包括商品ID、销售额、以及多种标签。原始数据的时间粒度为5毫秒,每个商品的所有标签都集中在一行中。

本数据集经过了以下转换:

  1. 标签拆分: 原始数据中所有标签都集中在一行中,被拆分成每行一个标签的形式,方便单独分析每个标签的影响。例如,原始数据中的ItemId字段被拆分为tag__id
  2. 时间聚合: 将5毫秒的时间粒度聚合到10秒的时间粒度,采用MAX函数作为聚合函数,即在10秒的时间窗口内,取销售额的最大值。

数据用途概述: 该数据集适用于商品销售数据的深入分析,可以用于以下场景:

  • 标签分析: 分析不同标签对商品销售额的影响,例如,研究特定商品类别或促销活动对销售额的贡献。
  • 时间序列分析: 分析商品销售额随时间的变化趋势,识别销售高峰和低谷,预测未来销售额。
  • 数据可视化: 通过可视化手段,展示销售额的变化趋势,标签的分布情况等,增强对数据的理解。
  • 模型训练: 可用于训练预测模型,例如,预测未来一段时间内的销售额。
packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.52 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。