约旦零售销售数据集
数据来源:互联网公开数据
标签:零售销售,约旦,顾客行为,数据分析,数据挖掘,市场趋势,消费者洞察
数据概述:
本数据集包含了约旦各地分支机构的模拟零售交易记录,涵盖了客户人口统计信息、购买详情、产品类别和支付方式等关键信息。数据旨在反映典型的零售交易情况,捕捉不同地区和职业的顾客行为和偏好。通过该数据集可以进行深入的数据挖掘和分析训练,发现多种趋势和模式,有助于探索消费者洞察和销售表现。
数据用途概述:
该数据集适用于数据挖掘、数据分析训练、市场趋势研究、消费者行为分析等多种场景。研究人员和分析人员可以利用此数据进行详细的客户行为分析,评估销售绩效和市场趋势;营销人员可以识别潜在的市场机会;企业也可以通过数据分析优化产品策略和营销方案。此外,该数据集还适合用于教育培训,帮助学习者掌握数据分析技能。
数据集字段说明:
- order_id:每个订单的唯一标识符,用于区分不同的交易。
- branch_name:发生交易的分支机构名称,指示地理位置。
- is_customer:布尔值(TRUE或FALSE),表示购买者是否为注册客户。
- customer_id:每个客户的唯一标识符,用于追踪客户特定的交易和人口统计信息。
- customer_profession:客户的行业,提供对客户职业和潜在购买力的见解。
- customer_income:客户每月收入,以约旦第纳尔(JOD)表示,用于分析收入相关的消费模式。
- purchase_date:购买日期,用于跟踪随时间变化的销售情况。
- purchase_time:购买的具体时间,提供高峰购物时段的信息。
- product_line:购买产品的标识符,链接到产品目录以获取详细的产品信息。
- unit_price:购买产品的单位价格,以约旦第纳尔(JOD)表示。
- quantity:交易中购买的产品数量。
- total_price:购买产品的总价格,计算方法为unit_price乘以quantity。
- tax_amount:应用于总价格的税额,计算方法为总价格的16%。
- customer_gender:客户的性别,用于人口统计分析。
- payment_method:交易使用的支付方式,指示客户对支付选项的偏好(Visa、CliQ、现金)。
数据集业务规则:
- 分支人口比例:每个分支的订单数量与其人口数量成比例。
- 客户行业和收入:客户的行业以特定概率分配,政府雇员的概率较高。每个行业的收入遵循基于预定义平均收入值的正态分布。
- 客户性别分布:性别随机分配给客户,某些分支机构有特定性别的偏好(例如,Karak、Tafila、Ma'an更倾向于男性,而Amman更倾向于女性)。
- 支付方式:支付方式随机分配,但像Amman和Aqaba这样的城市地区使用Visa或CliQ的倾向更高。
- 购买日期和时间:购买日期的频率在2020年和2021年间降低。购买时间在一天内随机生成。
- 产品数量:购买的产品数量受客户收入和性别的影响。
- 价格和税额计算:单位价格随机设定在5至100约旦第纳尔之间。总价格通过将单位价格乘以数量计算得出。税额为总价格的16%。
- 产品选择:每个订单包含随机选择的产品,订单中包含的产品数量根据购买者是否为注册客户而有所不同。
数据集趋势:
- 客户收入和消费:收入较高的行业可能会导致每笔订单中购买的产品数量更多。
- 分支特定性别偏好:某些分支机构表现出特定性别的购物行为趋势(例如,Karak、Tafila、Ma'an女性购物更多;Amman男性购物更多)。
- 支付方式偏好:城市地区如Amman和Aqaba更倾向于使用电子支付(Visa、CliQ)。
- 随时间变化的购买量:数据集中2020年和2021年的购买量较少,反映了COVID-19疫情期间的潜在现实趋势。
- 产品类别流行度:数据集中包括多样化的产品类别,允许分析哪些类别在不同客户群体中更受欢迎。
- 购买时间:分析购买时间可以揭示高峰购物时段。
- 分支销售表现:基于分支人口的比例分配订单,允许分析相对于分支规模的销售表现。