亚马逊英国销售额预测数据集
数据来源:互联网公开数据
标签:亚马逊,英国,销售额预测,时间序列,促销活动,消费价格指数,失业率,商业分析
数据概述
本数据集包含亚马逊在英国45家不同地区的门店从2019年2月5日至2021年11月1日的历史销售数据。每家门店下设多个部门,数据记录了每个部门在特定时期的销售额。此外,数据集还包含了与销售相关的外部因素,如地区平均气温、燃料价格、消费者价格指数(CPI)和失业率等。为了增强预测的准确性,数据集特别考虑了亚马逊在重要节假日前后开展的促销活动(Markdowns),并对这些活动对销售的影响进行了建模。部分Markdown数据仅在2011年11月后可用,且并非所有门店都存在完整的历史记录。
数据用途概述
该数据集适用于多种商业分析和预测场景,特别是销售额预测和促销活动效果评估。具体应用场景包括:
1. 时间序列分析:分析亚马逊在英国的销售额随时间的变化趋势,识别季节性波动和长期趋势。
2. 促销活动评估:研究亚马逊促销活动(Markdowns)对销售额的影响,特别是在重要节假日(如超级碗、劳动节、感恩节和圣诞节)期间的销售表现。
3. 外部因素分析:探索气温、燃料价格、CPI和失业率等外部因素对销售额的潜在影响,为业务决策提供依据。
4. 门店和部门绩效分析:比较不同门店和部门的销售表现,识别高增长或低表现的领域,指导资源分配和策略调整。
5. 预测模型开发:利用历史数据构建销售额预测模型,为企业制定未来销售计划提供支持。
字段定义
以下是对数据集中关键字段的详细说明:
- Store
- 定义:门店编号,代表亚马逊在英国的45家不同门店。
- 类型:整数
-
描述:每家门店可能涵盖多个部门,销售数据按部门进行细分。
-
Dept
- 定义:部门编号,代表门店内的具体业务部门。
- 类型:整数
-
描述:每个部门的销售数据单独记录,便于分析不同业务领域的表现。
-
Date
- 定义:日期字段,表示数据记录的周起始日期。
- 类型:日期
-
描述:数据按周汇总,便于进行时间序列分析。
-
Weekly_Sales
- 定义:周销售额,代表特定部门在指定门店的销售额。
- 类型:浮点数
-
描述:用于评估销售趋势和预测未来销售额。
-
IsHoliday
- 定义:布尔字段,指示当前周是否为重要节假日。
- 类型:布尔值(True/False)
-
描述:标记包括超级碗、劳动节、感恩节和圣诞节在内的关键节假日,这些周的权重在评估中被放大。
-
Temperature
- 定义:地区平均气温,以摄氏度为单位。
- 类型:浮点数
-
描述:反映外部环境对销售的影响,特别是在季节性波动中。
-
Fuel_Price
- 定义:地区燃料价格,以每升货币单位表示。
- 类型:浮点数
-
描述:反映燃料价格变化对消费者购买力和交通成本的影响。
-
MarkDown1-5
- 定义:匿名促销活动数据(Markdowns),表示亚马逊开展的促销活动。
- 类型:浮点数(部分缺失值标记为NA)
-
描述:促销活动数据仅在2011年11月后可用,且并非所有门店都具备完整记录。这些字段有助于分析促销活动对销售的短期和长期影响。
-
CPI
- 定义:消费者价格指数,反映地区整体物价水平。
- 类型:浮点数
-
描述:用于评估经济环境对销售的影响,特别是在通货膨胀或通货紧缩的情况下。
-
Unemployment
- 定义:地区失业率,表示劳动力市场的健康状况。
- 类型:浮点数
- 描述:失业率较高的地区可能影响消费者的购买力,从而间接影响销售额。
数据特征
1. 时间跨度:数据覆盖2019年2月5日至2021年11月1日,总计约2.5年的历史记录。
2. 数据颗粒度:以周为单位汇总销售数据,适合时间序列分析。
3. 节假日权重:超级碗、劳动节、感恩节和圣诞节等重要节假日的销售数据在评估中被放大5倍,强调其对销售的特殊影响。
4. 外部因素:包含气温、燃料价格、CPI和失业率等外部经济指标,有助于全面分析销售额的驱动因素。
5. 促销活动:部分门店和时间存在匿名的促销活动数据(Markdowns),可用于评估促销活动对销售额的影响。
应用场景
1. 销售额预测:利用历史数据构建预测模型,预测未来周的销售额,支持企业制定销售计划和库存管理策略。
2. 促销活动优化:分析不同促销活动对销售额的实际影响,优化促销策略,提升投资回报率。
3. 外部因素分析:研究气温、燃料价格、CPI和失业率等外部因素对销售额的潜在影响,为商业决策提供依据。
4. 门店和部门绩效评估:比较不同门店和部门的销售表现,识别高增长或低表现的领域,指导资源分配和策略调整。
5. 节假日销售策略:基于重要节假日的销售数据,制定针对性的营销和促销策略,提升节假日销售表现。
数据限制
1. 部分数据缺失:Markdown数据仅在2011年11月后可用,且并非所有门店都具备完整记录,存在部分缺失值(标记为NA)。
2. 外部因素覆盖范围:气温、燃料价格、CPI和失业率等外部因素以地区为单位汇总,可能存在局部偏差。
3. 门店和部门分类:数据集未提供关于门店类型和规模的详细分类,部分门店信息仅以编号表示。
通过本数据集,研究人员、企业决策者和数据分析师可以深入探索亚马逊在英国的销售模式、促销活动效果以及外部经济因素的影响,为商业决策提供有力支持。