数据集概述
该数据集是舒伯特《冬之旅》24首歌曲的多模态数据集,包含歌词文本、乐谱(图像、符号、MIDI格式)、音频录音等原始材料,以及乐谱与音频的小节位置、和弦、调性、结构分析等标注材料,从2.0版本起新增音符音高、乐器标签等半自动化标注。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 原始数据目录 (01_RawData):
- lyrics_txt: 歌曲歌词文本文件
- score-IMSLP_png: 乐谱图片文件
- score-IMSLP_pdf-complete.pdf: 完整乐谱PDF文件
- score_sibelius: Sibelius格式乐谱文件
- score_pdf: 乐谱PDF文件
- score_musicxml: MusicXML格式乐谱文件
- score_midi: MIDI格式乐谱文件
- audio_wav: WAV格式音频录音文件(受版权限制仅含2个)
- 标注材料目录 (02_Annotations):
- ann_score-IMSLP_measure: 乐谱小节位置标注
- ann_score_chord: 乐谱和弦分析标注
- ann_score_localkey-ann1/ann2/ann3: 乐谱局部调性分析标注(3种标注)
- ann_score_globalkey.csv: 乐谱全局调性分析CSV文件
- ann_score_structure: 乐谱结构分析标注
- ann_audio_measure: 音频小节位置标注
- ann_audio_chord: 音频和弦分析标注
- ann_audio_localkey-ann1/ann2/ann3: 音频局部调性分析标注(3种标注)
- ann_audio_globalkey.csv: 音频全局调性分析CSV文件
- ann_audio_structure: 音频结构分析标注
- ann_audio_note: 音频音符标注(含音高、音级、乐器标签)
- 额外材料目录 (03_ExtraMaterial):
- original data: 原始数据文件
- scripts for cutting: 切割脚本文件
- licenses of the published performances: 已发布录音的许可文件
适用场景
- 音乐信息检索研究: 用于开发乐谱与音频的自动对齐、和弦识别等算法
- 音乐学分析: 支持《冬之旅》的调性结构、表演差异等学术研究
- 数字人文研究: 探索音乐与歌词文本的多模态关联分析
- 音乐教育应用: 辅助《冬之旅》作品的教学与学习资源开发