动漫数据集-用户评分与热门趋势分析2023-arnavvvvv
数据来源:互联网公开数据
标签:动漫,评分,用户,趋势分析,推荐系统,情感分析,自然语言处理
数据概述:
本数据集包含从MyAnimeList.net爬取的动漫相关信息,包括16,000部动漫、130,000条用户评论和47,000个用户资料。数据集由三个CSV文件组成:
1. animes.csv:列出所有动漫的详细信息,包括标题、别名、类型、时长、排名、流行度、评分、播出日期和集数等,提供有关动漫各个重要方面的趋势数据。
2. profiles.csv:包含观看动漫的用户信息,包括用户名、出生日期、性别和最爱动漫列表。
3. reviews.csv:包含用户对动漫的评论信息,包括评论文本和评分。
数据集中的排名以浮点数格式表示,但实际上只包含整数值,这是因为NaN值在Pandas中的表示方式。
数据用途概述:
该数据集适用于推荐系统、情感分析和其他自然语言处理场景。通过分析评分和类型,可以了解动漫的趋势及其类型的变化。研究人员可以利用这些数据进行趋势研究、推荐系统开发、用户行为分析和语言模型训练等。分析师可以通过用户评论了解公众对不同动漫的偏好,并据此评估动漫的市场表现和流行趋势。