音乐情感分析数据集-90001首歌曲情感标签2021-cakiki
数据来源:互联网公开数据
标签:音乐情感,情感分析,社会标签,Last.fm,音乐标签,音乐分类,情感维度,情感计算
数据概述:
本数据集包含90,001首歌曲的情感信息。每首歌曲的情感通过分析其在Last.fm上的社会标签推导得出,这些标签来源于Warriner等人构建的情感数据库,并被划分为三个维度:
1. valence(愉悦度):刺激物的愉悦性。
2. arousal(唤起度):刺激物引起的强烈程度。
3. dominance(控制度):刺激物施加的控制程度。
数据集中的某些行包含MusicBrainz标识符(mbid)和Spotify标识符(spotify_id),这些标识符可用于获取更多关于特定歌曲的信息。此外,通过将Last.fm上的社会标签与预定义的音乐流派列表进行比较,可以推断出歌曲的流派。
注意事项:
此数据集仅作为一个正在进行中的工作概念证明。请注意,通过分析众包数据中的文本信息来估计歌曲传达的情感存在一定的间接性。由于某些歌曲在Last.fm上数据不足且具有相同的种子标签,导致数据集中出现了大量重复项(不同歌曲在情感空间中的相同位置)。这并不意味着这些歌曲具有相同的情感,而是数据收集过程需要改进:数据集的下一个版本将解决标签多样性问题,重点关注扩大数据集规模、实施质量检查以及尝试其他情感词典。
数据来源:
数据集的创建过程详细描述于《Toward a Musical Sentiment (MuSe) Dataset for Affective Distant Hearing》一文,该文在2020年计算人文研究工作坊(CHR 2020)上发表。
引用:
@article{akiki2021muse,
title={MuSe: The Musical Sentiment Dataset},
author={Akiki, Christopher and Burghardt, Manuel},
journal={Journal of Open Humanities Data},
volume={7},
year={2021},
publisher={Ubiquity Press}
}