-
Dogon_ATR_Based多贡语比较词干数据
2026年2月9日 30 79 28
数据集概述 本数据集包含多贡语(Dogon languages)间的ATR(高级舌冠根Advanced Tongue Root)比较词干数据,旨在为语言学研究提供多贡语族内词汇形态的对比分析基础。数据集仅包含一个文档文件。 文件详解 文件名称:Dogon ATR appendix.docx 文件格式:DOCX...
-
日琉方言_疑问文调查数据_2023_数据分卷
2026年2月1日 30 205 172
数据集概述 本数据集是日琉方言疑问文及疑问表现的调查工具与研究结果分卷,与同系列(1)共同构成完整数据集。内容包含方言疑问表现调查票、7个地区方言的调查结果(含部分音声数据)及相关研究论文,用于日琉方言疑问表现的描述与对照研究。 文件详解 文件名称:intr_20230323_2.zip 文件格式:ZIP...
-
VeLeRo_Based_罗马尼亚语动词屈折词库数据
2026年1月31日 30 157 39
数据集概述 本数据集为VeLeRo,即标准罗马尼亚语的屈折动词词库,包含7297个动词的完整语音形式词形变化范式,提供词元级和词形单元级频率数据。数据集共10个文件,涵盖数据文件、文档、代码及元数据等类型,支持罗马尼亚语形态学研究与分析。 文件详解 数据文件(CSV格式,共5个)...
-
Ihanzu_ELAR_词汇诱导会话修改版音频处理教程数据
2026年1月30日 30 82 40
数据集概述 本数据集为Andrew Harvey开展的3次Ihanzu词汇诱导会话的修改版本,原始数据来自濒危语言档案库(ELAR)。数据已重采样为16 kHz单声道16位PCM格式,适用于音频处理教程,包含3个文件,可通过Zenodo获取。 文件详解 文件名称:ihanzu-harvey-0596_20180518opq.zip 文件格式:ZIP...
-
VeLeCa_Source_加泰罗尼亚语动词词形变化词库数据
2026年1月29日 30 85 55
数据集概述 本数据集为VeLeCa,即加泰罗尼亚语动词屈折变化词库,包含三千四百八十四个词位的十七万四千二百个词形的语音形式,以及对应的词汇、形态句法属性和频率数据。数据集总计十个文件,覆盖数据、文档、代码等类型,为加泰罗尼亚语动词的语言学研究提供结构化资源。 文件详解 数据文件(CSV格式,共5个)...
-
Gauchat_1925_瑞士罗曼什方言语音表CLDF数据集
2026年1月29日 30 76 10
数据集概述 本数据集是基于Gauchat等人1925年的《瑞士罗曼什方言语音表》构建的CLDF格式数据集,核心内容为瑞士罗曼什方言的语音表信息,是研究该方言语音特征的重要历史语言学资料。 文件详解 文件名称:lexibank/tppsr-v1.1.1.zip 文件格式:ZIP...
-
La_Pola_Siero_阿斯图里亚斯地图第2问方言语料数据
2026年1月29日 30 27 4
数据集概述 本数据集为阿斯图里亚斯地图第2问相关的La Pola Siero方言语料,包含一份文档文件,聚焦该方言在特定问题场景下的语言表达,为方言研究提供原始语料支持。 文件详解 文件名称:Mapa de Asturias.Pregunta2.docx 文件格式:DOCX...
-
-
MaReTE_Based_古埃及象形文字词汇音译模型数据_2023
2026年1月27日 30 118 101
数据集概述 本数据集包含基于Ramses音译语料库和AES古埃及语句料库构建的古埃及象形文字词汇音译模型,用于实现象形文字到现代文字的音译转换。数据集提供训练好的模型文件、辅助文件及源码,支持古埃及文字数字化研究,共包含9个文件。 文件详解 文档类文件 文件名称:Readme.txt 文件格式:TXT...
-
Minspeech_Source_闽南语语音识别语料库数据v1_0_0
2026年1月26日 30 20 0
数据集概述 本数据集为闽南语方言语音识别语料库(Minspeech v1.0.0),包含用于自动语音识别的闽南语语音数据,整体以压缩包形式存储,未划分训练/测试集、数据/标签集及原始/处理数据,无额外目录层级。 文件详解 文件名称:Minspeech-1.0.0.zip 文件格式:ZIP...
-
CLDF_Derived_声音象征类型学语义与语音特征数据集2020
2026年1月23日 30 114 23
数据集概述 本数据集是基于Johansson等人2020年发表的《声音象征类型学》研究生成的CLDF格式数据集,核心内容为通过语义和语音特征定义宏观概念的声音象征类型学研究数据,包含一个压缩文件,便于语言类型学领域的研究与分析。 文件详解 压缩文件 文件名称:lexibank/johanssonsoundsymbolic-v1.3.zip...
-
历史语言学补充资料_蔡家语言数据集_Sagart_250_概念词表数据
2026年1月23日 30 3 1
数据集概述 本数据集是论文《从历时角度看蔡家语值得注意的语音特征》的补充材料,包含基于Sagart 250概念框架构建的蔡家语词汇表,用于支撑蔡家语语音特征的历时研究,为历史语言学领域提供结构化的词汇数据参考。 文件详解 文件名称:Caijia - Sagart 250-concept list.xlsx 文件格式:XLSX...
-
Kara_Nonopai_Frog_Story_多格式口头传统记录数据
2026年1月22日 30 39 15
数据集概述 本数据集包含Kara Nonopai语言使用者Lilian Maturau讲述的青蛙故事相关记录,涵盖原始与编辑版本的多格式文件,共5个文件,用于保存和展示该语言的口头叙事内容。 文件详解 文件名称:Kara_Nonopai_Frog Story.MOV 文件格式:MOV 字段映射介绍:青蛙故事的视频记录文件...
-
La_Pola_Siero_Based_阿斯图里亚斯地图第五问口语语料数据
2026年1月21日 30 100 95
数据集概述 本数据集为关于阿斯图里亚斯地图第五问的口语语料数据,来自La Pola Siero地区的口语语料库。数据集包含1个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,主要文件类型为DOCX格式。 文件详解 文件名称:Mapa de Asturias.Pregunta5.docx 文件格式:DOCX...
-
Thorsten_Voice_Based_黑森方言语音数据集2023_09
2026年1月21日 30 148 126
数据集概述 本数据集为Thorsten-Voice项目的一部分,聚焦德语黑森方言(Hessisch),包含2108条语音短语。语音由Thorsten Müller录制,Dominik Kreutz优化音频,采用LJSpeech结构,采样率22.050Hz,单声道,归一化至-24dB,无首尾静音,以CC0协议开放授权。 文件详解...
-
Chinese_Speech_to_Text_Based中文学习者语音样本与转录数据
2026年1月18日 30 172 30
数据集概述 本数据集包含31名学习者的中文语音样本(单词语音),以及对应的转录文本和准确率评分,用于支持中文语音转文字相关的研究与应用。数据集仅包含一个文件,无训练/测试、数据/标签或原始/处理数据的划分。 文件详解 文件名称:Dataset Chinese Speech to Text.xlsx 文件格式:XLSX...
-
Canis_familiaris_Based_家犬单调语音流意义内容识别实验数据
2026年1月15日 30 88 30
数据集概述 本数据集围绕家犬(Canis familiaris)对人类单调语音流中意义内容的识别能力展开,包含实验设计、样本数据、结果统计等核心内容。实验通过向家犬播放含意义/无意义短语的单调语音,观察其对主人的注视反应,验证家犬在无夸张韵律提示下识别语音意义的能力,为动物行为学研究提供支撑。 文件详解 文档类文件(.docx格式)...
-
Wangerooge_Frisian_Based_已灭绝东弗里斯兰语录音转录数据集
2026年1月15日 30 8 3
数据集概述 本数据集包含已灭绝的东弗里斯兰语——Wangerooge弗里斯兰语的转录录音资料,总时长34分钟。录音于1924-1927年采集,涉及4位母语使用者,2024-25年完成转录,提供音频及对应的文本转录与英文翻译,是该濒危语言研究的重要资料。 文件详解 压缩包文件(Archive files) 文件名称:包括rec-br-...
-
VeLePa_Verbal_Lexicon_of_Central_Pame动词词库数据
2026年1月14日 30 99 25
数据集概述 本数据集为VeLePa,是一个包含中部帕梅语(Central Pame)动词屈折变化的词库,涵盖216个动词的词形变化范式,共12528个语音形式的提取词汇,并提供词形单元和词位的频率信息。中部帕梅语属于奥托曼盖语系,以其复杂的形态结构和四重并发分类系统(前缀、词干、声调重音、后缀均显示屈折类和不规则性)为特点,具有语言学研究价值。...
-
Factoring_lexical_phonetic_phylogenetic_研究辅助材料数据
2026年1月9日 30 139 53
数据集概述 本数据集为论文“Factoring lexical and phonetic phylogenetic characters from word lists”的辅助材料,包含分析所需的脚本与数据文件,支持复现研究内容。文件涵盖结果文本、代码脚本、配置文件等,共十六个文件,可通过README.md了解使用细节。 文件详解 文档类文件...



