RecBot代理多规模数据集关联规则挖掘完整实验数据

数据集概述

本数据集包含RecBot推荐代理的完整输入和输出文件,主要用于关联规则挖掘实验。数据涵盖不同规模的数据集(从3K到1536K),包含输入CSV文件和代理运行生成的输出文件。输出内容包括频繁项集、关联规则和执行时间等关键结果,适用于推荐算法性能分析和关联规则挖掘研究。

文件详解

  • 输入数据文件(Inputs)
  • 文件名称: inputs/DB*.csv(如DB3K.csv, DB96K.csv, DB768K.csv等)
  • 文件格式: CSV
  • 字段映射介绍: CSV文件包含交易数据,每行代表一个交易记录,格式为"0,商品ID"的序列,用于关联规则挖掘的输入。
  • 输出结果文件(Outputs)
  • 文件名称: 遵循outputs/db[规模]/[类型]/sup[编号]/目录结构下的各类输出文件
  • 文件格式: 主要为TXT,少量INI和CSV
  • 字段映射介绍:
  • outputItemSet.txt:频繁项集及其支持度信息
  • outputRule.txt:挖掘出的关联规则
  • exectimes.txt:算法执行时间记录
  • desktop.ini:系统配置文件

适用场景

  • 推荐算法性能评估: 分析RecBot代理在不同数据规模下的关联规则挖掘效果和效率
  • 关联规则挖掘研究: 研究频繁项集发现和关联规则生成算法在实际数据集上的表现
  • 算法执行时间分析: 基于exectimes.txt文件分析算法的时间复杂度和性能瓶颈
  • 数据规模影响研究: 比较不同数据量级(3K-1536K)对推荐系统效果的影响
  • 推荐系统优化: 为推荐算法的参数调优和性能改进提供实验数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 17.57 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。