CompMusic_京剧唱腔人工标注数据集

数据集概述

本数据集包含34段京剧唱腔,通过Praat软件进行多维度人工标注,覆盖西皮、二黄两大声腔及旦、净、老旦、老生、小生五种角色类型。每段唱腔对应Praat TextGrid标注文件,包含唱腔名称、表演者、声腔、板式等层级信息,同时提供ariaInfo.txt汇总文件,支持京剧唱腔结构分析与音乐信息检索研究。

文件详解

  • 文件名称:annotated_jingju_arias_1.0.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含34个Praat TextGrid标注文件(每段唱腔对应一个)及1个ariaInfo.txt汇总文件。TextGrid文件含10个标注层级:aria(唱腔名称)、MBID(音频ID)、artist(表演者)、school(流派)、role-type(角色类型)、shengqiang(声腔边界与标签)、banshi(板式边界与标签)、lyrics-lines(唱词行边界与内容)、lyrics-syllables(唱词音节边界与内容)、luogu(锣鼓经模式边界与标签);ariaInfo.txt为数据集整体内容摘要。

数据来源

Computational Musicology Group (CompMusic), Universitat Pompeu Fabra

适用场景

  • 京剧唱腔结构分析: 基于声腔、板式、唱词等标注层级,研究京剧唱腔的结构特征与分段规律。
  • 音乐信息检索: 利用多维度标注数据,开发京剧唱腔的自动识别、分类与检索模型。
  • 语言与旋律关系研究: 分析京剧唱词声调与旋律轮廓的对应关系,支持相关语言学与音乐学交叉研究。
  • 京剧流派与角色类型识别: 基于表演者、流派、角色类型标注,构建流派与角色类型的自动分类系统。
  • 锣鼓经模式分析: 通过锣鼓经标注层级,研究京剧伴奏中锣鼓经的使用规律与结构特征。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.25 MiB
最后更新 2026年2月2日
创建于 2026年2月2日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。