公平推荐系统数据集_Fair_RecSys

数据集概述

该数据集包含四个多媒体推荐系统数据集,用于研究推荐系统中的流行度偏差与公平性问题。每个数据集基于公开基准数据构建,包含用户交互记录及按主流偏好划分的用户分组数据,为公平推荐算法的开发与评估提供支持。

文件详解

该数据集包含四个压缩包文件,每个压缩包对应一个推荐系统场景,内部文件结构统一: - 压缩包文件(共4个): - lfm.zip:基于Last.fm数据的压缩包 - ml.zip:基于MovieLens数据的压缩包 - book.zip:基于BookCrossing数据的压缩包 - anime.zip:基于MyAnimeList数据的压缩包 - 各压缩包内包含两类文件: - 用户交互文件(user_events.txt):格式为"user,item,preference",记录用户与项目的交互数据 - 用户分组文件:包含low_main_users.txt、med_main_users.txt、high_main_users.txt三个文件,格式为"user,mainstreaminess",按用户对流行项目的偏好程度划分用户组

数据来源

  • JKU Linz(Last.fm数据来源)
  • GroupLens(MovieLens数据来源)
  • Uni Freiburg(BookCrossing数据来源)
  • Kaggle(MyAnimeList数据来源)

适用场景

  • 推荐系统公平性研究:分析不同用户群体在推荐结果中的流行度偏差问题
  • 算法评估:测试推荐算法在缓解流行度偏差、提升小众项目曝光方面的效果
  • 用户行为分析:探究用户对流行/主流项目的偏好差异及其影响因素
  • 公平推荐算法开发:为构建兼顾效率与公平性的推荐模型提供实验数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 15.53 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。