数据集概述
本数据集包含5万条布尔型交易记录,每条记录涵盖10种常见商品(如面包、黄油、咖啡等)的购买情况。数据采用布尔值(True/False)表示商品在单次交易中的存在与否,所有字段均无缺失值。数据集结构简洁,适用于商品关联分析和购物篮模式挖掘。
文件详解
- 文件名称:
synthetic_transactions_50k.csv
- 文件格式: CSV
- 字段映射介绍: 包含10个布尔型字段,分别对应以下商品:
- Bread(面包)
- Butter(黄油)
- Cereal(谷物)
- Cheese(奶酪)
- Coffee(咖啡)
- Eggs(鸡蛋)
- Juice(果汁)
- Milk(牛奶)
- Tea(茶)
- Yogurt(酸奶)
每个字段的取值为True(购买)或False(未购买)。
适用场景
- 关联规则挖掘: 通过Apriori等算法分析商品间的共现关系,挖掘频繁项集和关联规则(如"购买面包时同时购买黄油")。
- 购物篮分析: 研究消费者的购买组合模式,为商品陈列、促销策略和交叉销售提供数据支持。
- 市场篮子建模: 构建消费者购买行为模型,优化库存管理和商品推荐系统。
- 布尔型数据模式识别: 作为典型的布尔数据集,可用于测试和验证分类、聚类等机器学习算法的性能。