动漫MyAnimeList用户评分数据集
数据来源:互联网公开数据
标签:用户评分,动漫,MyAnimeList,机器学习,推荐系统,数据分析,用户行为
数据概述:
本数据集包含来自MyAnimeList网站的超过4400万条动漫相关数据,涵盖了18,145个独特用户对16,135个动漫作品的互动记录。数据集由四个文件组成:
1. anime_titles.csv
:包含所有动漫作品的基本信息,包括MyAnimeList ID、标题、平均评分、类型、动画工作室、剧情简介、媒介类型(如TV、电影)以及集数等。
2. anime_user_ratings.csv
:包含超过4000万条用户评分数据,记录了用户的MyAnimeList ID、动漫ID、标题、观看状态(已完成或已放弃)、用户评分、观看集数、是否重看以及评分时间戳。
3. anime_genres.csv
:为每部动漫作品提供类型相关的哑变量数据,便于后续分析和建模使用。
4. username_list_full.csv
:列出从MyAnimeList上抓取的超过7万名用户的用户名。
数据用途概述:
该数据集适用于多种场景,包括但不限于:
- 用户行为分析:研究用户的观看习惯、评分偏好及动漫类型偏好。
- 推荐系统构建:通过分析用户评分数据,构建基于内容或协同过滤的推荐系统,为用户提供个性化动漫推荐。
- 动漫分类与聚类:利用类型数据和用户评分,对动漫进行分类或聚类分析,挖掘不同类型的动漫特征及其受众群体。
- 市场趋势分析:分析不同时间段内热门动漫及其类型的变化趋势,为内容制作和市场推广提供参考。
- 机器学习模型训练:利用评分数据和用户行为数据,训练预测模型,预测用户的评分或观看意愿。
该数据集为研究动漫行业、用户行为及推荐系统提供了丰富的数据支持,适用于学术研究、商业分析及技术开发等多种场景。