-
TextGrid_CC_BY_3_0授权_XML格式语料库数据
2026年1月28日 30 57 14
数据集概述 本数据集为XML格式的文本语料库压缩包,所有文本源自TextGrid平台,由Katrin Dennerlein博士整理。语料库采用CC-BY 3.0协议授权,相关研究在《席勒-克莱斯特不确定性原理》中被提及,可用于计算机语言学或文本分析相关研究。 文件详解 文件名称:XML.zip 文件格式:ZIP(压缩包)...
-
CompMusic_京剧唱腔人工标注数据集
2026年2月2日 30 22 4
数据集概述 本数据集包含34段京剧唱腔,通过Praat软件进行多维度人工标注,覆盖西皮、二黄两大声腔及旦、净、老旦、老生、小生五种角色类型。每段唱腔对应Praat TextGrid标注文件,包含唱腔名称、表演者、声腔、板式等层级信息,同时提供ariaInfo.txt汇总文件,支持京剧唱腔结构分析与音乐信息检索研究。 文件详解...
-
XML_corpus_Based_文学文本XML语料库数据
2026年1月30日 30 56 55
数据集概述 本数据集为XML格式的文学文本语料库,包含席勒、莱辛、克莱斯特、歌德、蒂克等作家的作品,共56个XML文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理集,所有文件均为XML格式,其中5个含XML元数据。 文件详解 核心文件:...
-
Turkish_Makam_Based_专业歌手演唱的无伴奏合唱片段数据集_2_0
2026年1月15日 30 170 157
数据集概述 本数据集为土耳其木卡姆(Turkish makam)风格的无伴奏合唱(acapella)片段录音集合,由专业歌手演唱,曲目选自声乐形式“şarkı”,与http://compmusic.upf.edu/turkish-sarki第二版录音对应,旨在为复调录音提供无伴奏合唱对照数据,包含音频及文本标注。 文件详解 文件名称:turkish-...
-
土耳其Şarkı声乐数据集2_0
2025年12月21日 30 32 17
数据集概述 该数据集为土耳其传统声乐形式Şarkı的录音集合,包含11首作品的12段表演(8段女声、4段男声),并提供歌词短语与音频片段的对齐标注,支持音频与歌词的匹配研究。 文件详解 文件名称:turkish_sarki_vocal_v2.0.zip 文件格式:ZIP压缩包...
-
LJ语音_国际音标对齐转录数据集
2025年12月11日 30 73 60
数据集概述 该数据集为LJ语音数据提供国际音标(IPA)对齐转录内容,包含文本网格文件、词汇表、音素时长分析图表、发音词典及结果复现脚本,支持语音处理相关研究与应用。 文件详解 grids.zip:压缩文件,包含所有音频对应的TextGrid文件,每个文件含三个层级: words层级:对齐的标准化英文单词...
-
京剧清唱数据集第三部分
2025年12月6日 30 16 2
数据集概述 该数据集为京剧清唱数据库第三部分,聚焦音乐教育应用,采集了专业京剧演员的示范录音与非专业学生(小学生、大学生)的学习录音,包含多粒度标注信息,为京剧演唱教学研究提供数据支持。 文件详解 音频文件包: wav_left.zip: WAV格式单声道音频文件 标注文件包: textgrid.zip: Praat...
-
THCHS_30_国际音标对齐转录数据集
2025年12月4日 30 77 12
数据集概述 该数据集为OpenSLR平台THCHS-30数据集提供国际音标(IPA)对齐转录,包含标点添加、静音标记及音素时长标记,标注文件首尾静音,支持语音处理相关研究。 文件详解 压缩文件: grids.zip:...



