MyAnimeList动漫数据分析平台数据-动漫作品信息-评分与排名数据集
数据来源:互联网公开数据
标签:动漫,MyAnimeList,动漫排名,评分,观众,动漫分析,作品信息,时间序列,流媒体
数据概述:
本数据集来源于MyAnimeList(MAL)网站的API,包含了大量关于动漫作品的信息、评分和排名数据。数据提取自MAL网站的详细信息API,旨在为动漫爱好者和数据分析师提供一个全面的动漫数据资源。数据集涵盖了动漫作品的标题、主要图片链接、备用标题、开始日期、结束日期、简介、媒体类型、状态、剧集数量、首播季年份、首播季季度、评级、NSFW内容标识、受众群体、类型、制作工作室等关键字段。此外,还包括动漫的排名、平均评分、排名类别、受欢迎程度、评分用户数量、观看人数、已完成观看人数、搁置人数、已放弃观看人数、计划观看人数等。数据更新频率预计为每两周一次,具体取决于数据提供者的可用性和数据集的受欢迎程度。
数据用途概述:
该数据集适用于多种分析场景,包括但不限于:动漫趋势分析、受欢迎作品识别、评分模式研究、受众群体分析、流媒体平台内容推荐、动漫行业市场调研等。用户可以利用该数据跟踪不同时间段内最受欢迎的动漫作品,分析作品的评分情况,并根据类型、时间段和受众群体等维度进行深入探索。该数据集也适合用于构建动漫推荐系统,帮助用户发现更多符合个人喜好的动漫作品。
数据更新频率:
预计每两周更新一次,具体取决于数据提供者的可用性。
数据提取和处理说明:
数据提取和清洗过程在GitHub上详细说明。
数据仅包含“TV”类别下的动漫作品,以简化提取和分析流程。
数据集排除了所有成人内容(r+)。
在anime_table中,alternative_title字段使用了英文标题,如果英文标题为空,则使用默认标题。
受众群体信息从genres字段中提取,但部分字段可能为空。
数据清洗方法在GitHub上有所记录。
表结构:
所有表的主键(tm_ky表除外)都是其他表的外键。因此,这些表有两个或多个主键。
anime_demo_table(动漫受众群体表)
字段 类型 主键
tm_ky int PK
mal_id int PK
demo_id int PK
anime_genres_table(动漫类型表)
字段 类型 主键
tm_ky int PK
mal_id int PK
genres_id int PK
anime_ranking_table(动漫排名表)
字段 类型 主键
tm_ky int PK
mal_id int PK
mean dbl
rank int
popularity int
num_scoring_users int
statistics.watching int
statistics.completed int
statistics.on_hold int
statistics.dropped int
statistics.plan_to_watch int
statistics.num_scoring_users int
anime_studios_table(动漫制作工作室表)
字段 类型 主键
tm_ky int PK
mal_id int PK
studio_id int PK
anime_syn_table(动漫别名表)
字段 类型 主键
tm_ky int PK
mal_id int PK
synonyms chr
anime_table(动漫作品信息表)
字段 类型 主键
tm_ky int PK
mal_id int PK
title chr
main_picture.medium chr
main_picture.large chr
alternative_titles.en chr
alternative_titles.ja chr
start_date chr
end_date chr
synopsis chr
media_type chr
status chr
num_episodes int
start_season.year int
start_season.season chr
rating chr
nsfw chr
demo_de chr
genres_de chr
studios_de chr
synonyms chr
alternative_title chr
rank_table(排名表)
字段 类型 主键
tm_ky int PK
mal_id int PK
title chr
rank int
rank_category chr PK
demo_l(受众群体描述表)
字段 类型 主键
tm_ky int PK
demo_id int PK
demo_de chr
genres_l(类型描述表)
字段 类型 主键
tm_ky int PK
genres_id int PK
genres_de chr
studios_l(工作室描述表)
字段 类型 主键
tm_ky int PK
studio_id int PK
studio_de chr
tm_ky(时间戳表)
字段 类型 主键
tm_ky int PK
tm_ky_de chr