艾森民歌数据库MIDI转换与标记化数据集

艾森民歌数据库MIDI转换与标记化数据集 数据来源:互联网公开数据 标签:音乐信息检索,民歌,MIDI,标记化,音乐分析,文本生成,NLP,艾森民歌数据库

数据概述: 本数据集包含约8500个.mid音乐文件,这些文件是源自艾森民歌数据库(Essen Folksong Database,KernScores (ccarh.org))的原始音乐文件转换而来。这些.mid文件使用MidiTok库(一个专门用于.mid文件标记化的Python库)进行了标记化处理,并将结果存储在数据表(.csv)中。此外,数据库还包含了.txt文件,其中导出了提取的音乐参数。

数据用途概述: 该数据集被精心准备,旨在为音乐信息检索(MIR)领域的语料库研究提供可靠的基础,特别是用于探索使用自然语言处理(NLP)中常用的方法和工具进行数值到文本的转换。研究人员可以利用该数据集进行音乐风格分析、旋律生成、音乐结构分析等研究,并探索将音乐数据转化为文本形式,从而应用NLP技术进行分析的可能性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 44.91 MiB
最后更新 2025年4月17日
创建于 2025年4月17日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。