数据集概述
本数据集包含34段京剧唱腔,通过Praat软件进行多维度人工标注,覆盖西皮、二黄两大声腔及旦、净、老旦、老生、小生五种角色类型。每段唱腔对应Praat TextGrid标注文件,包含唱腔名称、表演者、声腔、板式等层级信息,同时提供ariaInfo.txt汇总文件,支持京剧唱腔结构分析与音乐信息检索研究。
文件详解
- 文件名称:annotated_jingju_arias_1.0.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含34个Praat TextGrid标注文件(每段唱腔对应一个)及1个ariaInfo.txt汇总文件。TextGrid文件含10个标注层级:aria(唱腔名称)、MBID(音频ID)、artist(表演者)、school(流派)、role-type(角色类型)、shengqiang(声腔边界与标签)、banshi(板式边界与标签)、lyrics-lines(唱词行边界与内容)、lyrics-syllables(唱词音节边界与内容)、luogu(锣鼓经模式边界与标签);ariaInfo.txt为数据集整体内容摘要。
数据来源
Computational Musicology Group (CompMusic), Universitat Pompeu Fabra
适用场景
- 京剧唱腔结构分析: 基于声腔、板式、唱词等标注层级,研究京剧唱腔的结构特征与分段规律。
- 音乐信息检索: 利用多维度标注数据,开发京剧唱腔的自动识别、分类与检索模型。
- 语言与旋律关系研究: 分析京剧唱词声调与旋律轮廓的对应关系,支持相关语言学与音乐学交叉研究。
- 京剧流派与角色类型识别: 基于表演者、流派、角色类型标注,构建流派与角色类型的自动分类系统。
- 锣鼓经模式分析: 通过锣鼓经标注层级,研究京剧伴奏中锣鼓经的使用规律与结构特征。