流行电影数据集9000部电影

流行电影数据集9000部电影 数据来源:互联网公开数据 标签:电影推荐,用户评分,电影标签,电影分类,电影数据,推荐系统,用户行为分析 数据概述: 本数据集(ml-latest-small)收录了MovieLens电影推荐服务中的5星级评分和自由文本标签活动数据。数据集包含1996年3月29日至2018年9月24日期间,610名用户对9742部电影的100836条评分和3683条标签应用记录。每个用户至少对20部电影进行了评分,数据集中没有包含用户的任何人口统计信息。 数据集包含以下文件:links.csv、movies.csv、ratings.csv和tags.csv。其中,movies.csv文件中的电影分类是一个以管道符号分隔的列表,分类选项包括:Action(动作)、Adventure(冒险)、Animation(动画)、Children's(儿童)、Comedy(喜剧)、Crime(犯罪)、Documentary(纪录片)、Drama(剧情)、Fantasy(奇幻)、Film-Noir(黑色电影)、Horror(恐怖)、Musical(音乐)、Mystery(悬疑)、Romance(爱情)、Sci-Fi(科幻)、Thriller(惊悚)、War(战争)、Western(西部)和(no genres listed)(无分类)。 数据用途概述: 该数据集适用于电影推荐系统研究、用户行为分析、电影分类研究等多种场景。研究人员可以通过此数据集探索用户评分和标签应用的趋势,帮助改进推荐算法;电影制片公司可以利用电影分类数据进行市场定位;同时,数据集也适合用于教育培训,帮助学习者理解电影推荐系统的工作原理。 使用许可: 明尼苏达大学及其研究人员不对数据的正确性、适用性或基于数据集得出的结果的有效性做出任何保证。数据集可用于任何研究目的,前提是遵循以下条件: 1. 用户不得声明或暗示明尼苏达大学或GroupLens研究组的认可。 2. 用户必须在使用数据集产生的出版物中注明数据集的使用情况(请参见下方引用信息)。 3. 用户可以重分发数据集(包括任何转换后的数据),但必须遵循相同的许可条件。 4. 用户不得将该信息用于任何商业或盈利目的,除非事先获得明尼苏达大学GroupLens研究项目组成员的许可。 5. 提供的可执行软件脚本“按原样”提供,不附带任何形式的明示或暗示的担保,包括但不限于适销性和特定用途适用性的担保。所有关于质量和服务的全部风险由用户承担。如果程序存在缺陷,用户须自行承担所有必要的服务、维修或修正费用。 6. 在任何情况下,明尼苏达大学及其附属机构或员工均不对因使用或无法使用这些程序而对用户造成的损害负责(包括但不限于数据丢失或数据不准确)。 引用: 在出版物中使用数据集时,请引用以下论文:

F. Maxwell Harper 和 Joseph A. Konstan. 2015. The MovieLens Datasets: History and Context. ACM Transactions on Interactive Intelligent Systems (TiiS) 5, 4: 19:1–19:19. https://doi.org/10.1145/2827872

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 11:32 (UTC)
创建于 四月 14, 2025, 11:32 (UTC)