H姓艺术家歌词录制数据集-2022-marzenah
数据来源:互联网公开数据
标签:歌词,艺术家,音乐分析,文本分析,时间序列,情感分析,主题分析,词频分析
数据概述:
本数据集包含从AZLyrics.com网站获取的34,572首由姓名以'H'开头的艺术家录制的歌曲数据。数据集于2022年6月进行处理,相关数据采集软件已发布在GitHub上。数据以CSV格式存储,每条记录代表一首歌曲的录制信息。
数据集包含以下字段:
Artist_Name:艺术家姓名
Song_Title:歌曲名称
Year:录制年份
Lyrics_URL:AZLyrics网站上的歌词链接
Lyrics:歌词文本(部分歌曲包含原始语言和翻译文本)
需要注意的是,某些歌曲由不同艺术家录制或在不同年份录制,因此数据集中唯一歌词文本数量为33,640,唯一URL数量为33,735,而总的录制记录数量为34,572。
数据用途概述:
该数据集适用于歌词文本分析,包括情感分析、主题分析、词汇重复性和多样性分析等。研究人员可以通过这一数据集在时间序列背景下研究歌词的变化趋势,或进行跨时间的比较分析。此外,教育者和学生可以利用该数据集进行音乐和语言学方面的研究。