滚石杂志评选的史上最伟大专辑数据集
数据来源:互联网公开数据
标签:音乐,专辑,排行榜,滚石杂志,文化,数据分析,音乐历史
数据概述:
本数据集收录了滚石杂志评选的“史上最伟大的500张专辑”相关数据,该榜单由滚石杂志编辑部基于两次大规模的调查结果编制而成。2003年,滚石杂志邀请了271位艺术家、制作人、行业高管和记者参与评选;2009年,又邀请了100位专家评选2000年代的最佳专辑。基于这两次调查结果,滚石杂志最终形成了这份“史上最伟大专辑”的榜单。数据包含了专辑名称、艺术家、发行年份、专辑流派、在榜单上的排名(2003年、2012年、2020年)、排名变化、在公告牌上的停留时间、公告牌最高排名、Spotify上的受欢迎程度等信息。
数据字典:
* sort_name:用于排序的名称
* clean_name:专辑的标准化名称
* album:专辑名称
* rank_2003:2003年榜单排名,如果专辑未发行或未进入前500名,则为NA。
* rank_2012:2012年榜单排名,如果专辑未发行或未进入前500名,则为NA。
* rank_2020:2020年榜单排名,如果专辑未进入前500名,则为NA。
* differential:2020年排名与2003年排名的差异。负值表示排名下降,正值表示排名上升。
* release_year:专辑发行年份
* genre:专辑流派
* type:专辑类型
* weeks_on_billboard:专辑在公告牌上的停留时间
* peak_billboard_position:专辑在公告牌上的最高排名
* spotify_popularity:Spotify上的受欢迎程度,如果未在Spotify上,则为NA。
* spotify_url:Spotify链接,如果未在Spotify上,则为NA。
* artist_member_count:艺术家成员数量
* artist_gender:艺术家性别,如果为混合性别团体,则为Male/Female。
* artist_birth_year_sum:艺术家出生年份的总和。例如,对于一个由两名成员组成的团体,其中一人出生于1945年,另一人出生于1950年,则该值为3895。
* debut_album_release_year:首张专辑发行年份
* ave_age_at_top_500:专辑进入Top 500时的平均年龄
* years_between:首张专辑发行年份与进入Top 500专辑年份的间隔年数
* album_id:专辑ID。如果未在Spotify上,则ID以NOS开头。
数据用途概述:
该数据集可用于音乐文化研究、音乐产业分析、专辑受欢迎程度趋势分析、音乐流派比较等多种场景。研究人员可以利用该数据分析不同时代、不同流派专辑的受欢迎程度变化;音乐爱好者可以根据数据探索不同专辑的音乐风格和历史背景;数据科学家可以基于此数据进行更深入的音乐推荐和预测模型构建。