MUSDB18_Lyrics_Based_多语言歌词扩展文本分析完整数据

本数据集是MUSDB18数据集的歌词标注扩展，包含九十八首训练集歌曲与四十五首测试集歌曲的英文歌词人工转录文本。歌词按三至十二秒自然停顿分段，部分有一秒重叠，提供词音素分解及辅助脚本，适用于文本辅助歌声分离等研究。

README.txt: TXT格式，包含数据集说明、使用条款、引用要求、数据结构及文件说明等核心信息
LICENSE.txt: TXT格式，Creative Commons Attribution-NonCommercial-ShareAlike 4.0国际许可协议全文
train_lyrics.zip: ZIP格式，训练集歌曲的歌词标注文件压缩包
test_lyrics.zip: ZIP格式，测试集歌曲的歌词标注文件压缩包
words_and_phonemes.txt: TXT格式，包含所有单词及其ARPABET风格音素分解的对应列表
musdb_lyrics_cut_audio.py: PY格式，可自动切割MUSDB音频至标注分段的Python脚本，需配置路径及参数

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	0.21 MiB
最后更新	2025年12月15日
创建于	2025年12月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。