电商用户行为与商品信息数据集-recepbattal
数据来源:互联网公开数据
标签:电商,用户行为,商品信息,SQL,数据清洗,特征工程,机器学习,用户画像,购物篮分析
数据概述:
本数据集包含两个主要文件夹:customer(用户)和item(商品),分别包含与用户交互和商品信息相关的数据。
Customer文件夹:
包含5个CSV文件,每个文件代表不同月份的用户行为事件。
每个文件包含以下列:
event_time:事件的时间戳。
event_type:事件类型(例如,view(浏览), add to cart(加入购物车), purchase(购买))。
product_id:产品的唯一标识符。
price:事件发生时产品的价格。
user_id:用户的唯一标识符。
user_session:用于跟踪用户行为的会话标识符。
Item文件夹:
包含一个CSV文件,其中包含商品信息。
包含以下列:
product_id:产品的唯一标识符。
category_id:产品类别的标识符。
category_code:代表产品类别的代码。
brand:产品的品牌名称。
数据用途概述:
该数据集非常适合初学者,可用于:
学习和练习在关系数据集上使用SQL查询。
执行数据清洗任务,例如处理缺失值、规范化文本和格式化数据。
尝试特征工程技术,以准备用于机器学习模型的数据。
它提供了一个实践机会,可以处理类似真实世界的数据,帮助学习者培养数据操作和分析的基础理解。