Spotify艺术家元数据与音乐特征数据集-2024年
数据来源:互联网公开数据
标签:Spotify, 音乐, 艺术家, 元数据, 音乐流派, 音乐分析, 流行度, 播放量, 音乐市场
数据概述:
本数据集包含Spotify平台艺术家元数据的(伪)随机抽样,数据截止至2024年。数据集旨在代表Spotify上所有艺术家的分布,避免偏向更知名或更受欢迎的艺术家。主要包含两部分信息:艺术家元数据和单曲元数据。
艺术家元数据包括:
* 艺术家唯一Spotify ID
* 艺术家姓名
* Spotify定义的流行度指标(需谨慎使用)
* 艺术家的关注者数量
* 艺术家所属的音乐流派(多个流派用逗号分隔)
* 艺术家首张专辑发行年份
* 艺术家最近一次专辑发行年份(截至2024年5月)
* 艺术家拥有的专辑数量,上限为20张
* 艺术家单曲中的总曲目数量
* 艺术家每月听众数量(2024年4月和5月收集)
单曲元数据:
为每个艺术家随机选择一首单曲,包含以下信息:
* 单曲唯一Spotify ID
* 单曲名称
* Spotify定义的流行度指标(需谨慎使用)
* 单曲可用的市场代码
* 参与创作单曲的艺术家Spotify ID(多个艺术家用逗号分隔)
* 单曲发行日期
* 单曲时长(毫秒)
* 声学特征(0.0-1.0)
* 舞曲性(0.0-1.0)
* 能量(0.0-1.0)
* 器乐性(0.0-1.0)
* 现场感(0.0-1.0)
* 响度(分贝)
* 语音性(0.0-1.0)
* 节奏(每分钟节拍数)
* 情感值(0.0-1.0)
* 音乐调性(0-11,-1表示未检测到)
* 音乐模式(1表示大调,0表示小调)
* 时间签名(3/4至7/4)
数据集包含三个文件:
* CLEANED_Spotify_artist_info.csv(约15,000名艺术家):所有列值非空的艺术家数据,除了“流行度”和“关注者”列。
* Spotify_artist_info.csv(约37,000名艺术家):包含所有艺术家的数据,包括CLEANED_Spotify_artist_info.csv中的数据,以及“流行度”和“关注者”列存在空值的艺术家数据。
* CLEANED_Spotify_artist_info_tracks.csv(约15,000首单曲):包含CLEANED_Spotify_artist_info.csv中每个艺术家的一首随机选择的单曲的元数据。
数据用途概述:
该数据集可用于多种研究和分析,例如:
* 研究Spotify上艺术家活跃度及其创作速率
* 比较不同音乐流派的月度听众分布
* 结合Spotify编辑精选歌单的数据,探索可能导致艺术家被收录到编辑精选歌单的因素(和偏见)
* 探索Spotify上艺术家的各种人口统计学特征
* 作为探索偏见或进行Spotify艺术家人口统计学研究的基线/比较数据