美国PC组件购买交易分析数据集-2021至2023年-swapnilprantamistry
数据来源:互联网公开数据
标签:PC组件,电子商务,零售销售,市场篮子分析,推荐系统,用户行为,时间序列分析,美国,城市,数据科学
数据概述:
本数据集提供了10,000笔模拟的PC组件购买交易的综合视图,利用Faker库生成。数据涵盖了过去两年内美国多个主要城市中不同用户购买的各种计算机组件的详细信息。该数据集适用于电子商务分析、机器学习、数据科学项目中的零售销售、推荐系统、市场分析和用户行为分析。
数据生成过程:
该数据集使用Python和Faker库生成,模拟了真实的用户名、交易日期和购买记录。每个交易对应一个唯一的用户,由user_id标识,并购买了一组随机选择的PC组件。交易记录包括用户ID、交易ID、购买人姓名、购买日期、居住城市和购买的项目(购买的组件列表)等信息。
数据字段/列
user_id:每个用户的唯一标识符(例如,USER0001, USER0002)。
transaction_id:每个交易的唯一标识符(例如,TX00001, TX00002)。
person:购买者的全名(由Faker生成)。
date:交易日期(跨度为过去两年)。
city:用户居住的城市,从美国主要城市列表中选择。
purchased_items:每笔交易中购买的计算机组件列表,用逗号分隔(例如,“CPU, GPU, RAM”)。
数据集关键特征
规模:10,000笔由多个用户进行的独立交易。
多样性:包含26种不同的PC组件,允许分析不同组件组合的购买情况。
地理多样性:数据包括来自美国21个不同城市的交易。
时间属性:交易跨度为过去两年,支持时间序列分析。
潜在应用场景
电子商务分析:理解客户购买行为、常购组件及流行产品组合。
市场篮子分析:识别不同组件之间的关联和模式。
推荐系统:基于先前购买建立模型,推荐PC组件。
零售销售分析:分析购买趋势和消费者偏好随时间的变化。
致谢:
该数据集使用Faker库生成合成数据,确保不包含任何真实用户信息。该数据集提供用于教育和研究目的。
许可:
该数据集在CC BY-SA 4.0: Public Domain许可下提供,这意味着您可以自由使用、分享和修改,只要您提供适当的署名。
灵感:
分析购买模式,了解哪些PC组件经常一起购买。
创建推荐模型,根据过去购买情况建议附加组件。
进行时间序列分析,识别PC组件销售中的季节性趋势。