-
哥伦比亚原住民语言比较词汇数据集1992
2025年12月16日 30 55 43
数据集概述 该数据集基于1992年Huber与Reed的《哥伦比亚原住民语言比较词汇》研究,以CLDF格式整理了哥伦比亚原住民语言的精选词汇数据,为语言比较研究提供结构化支持。 文件详解 文件名称:lexibank/hubercolumbian-v4.0.2.zip 文件格式:ZIP压缩包...
-
朱拉语词汇数据2019年1月
2025年12月14日 30 21 15
数据集概述 本数据集包含2019年1月在布基纳法索西部收集的朱拉语词汇数据,共涉及六十二条词汇。数据采用综合国家标准的音位正字法记录,并标注声调,为朱拉语语言学研究提供基础资料。 文件详解 词汇数据文件(LexiquePro导出): lexicon_2019-01_burkina.lift:LIFT...
-
Alor_Pantar语言家族内部分类CLDF数据集2012
2025年12月12日 30 159 54
数据集概述 本数据集是基于Robinson和Holton 2012年发表的研究,采用计算方法对Alor-Pantar语言家族词汇进行内部分类的CLDF格式数据集,为语言家族分类研究提供标准化数据支持。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: lexibank/robinsonap-v4.1.zip - 文件格式:...
-
CLDF格式扎格拉根马当比较词表数据集1980
2025年12月12日 30 178 37
数据集概述 该数据集为CLDF格式,基于扎格拉根1980年发表的《巴布亚新几内亚马当省北阿德伯特山脉语言比较词表》,包含巴布亚新几内亚特定区域语言的比较词汇数据,支持语言比较研究。 文件详解...
-
中国与老挝倮倮_缅甸语支Cosao语言分类数据集
2025年12月11日 30 174 85
数据集概述 该数据集围绕倮倮-缅甸语支的Cosao语言分类展开,包含其在中老边境的分布、词汇比较证据及计算系统发育学分析结果,明确其为南倮倮语支且与老挝Khir语言关系密切,为语言谱系研究提供数据支持。 文件详解 文件名称:The_classification_of_Cosao_PPT.pdf 文件格式:PDF...
-
越南苗瑶语系Na_Meo语言分类数据集
2025年12月11日 30 71 9
数据集概述 本数据集围绕越南苗瑶语系Na Meo语言的分类研究展开,包含田野调查收集的词汇数据、对比分析材料及研究成果文档,为验证Na Meo归属黔东苗语分支及探究其迁徙起源提供数据支持。 文件详解 研究文档: The_classification_of_Na_Meo_PPT.pdf: PDF格式,可能为研究内容的PPT演示文档...
-
基于Marrison1967年_印度东北部那加语言_的CLDF数据集
2025年12月10日 30 135 102
数据集概述 该数据集是基于Marrison1967年《印度东北部那加语言》的CLDF格式数据集,核心内容为印度东北部那加语言的分类相关数据,以压缩包形式存储。 文件详解 文件名称:lexibank/marrisonnaga-v3.1.zip 文件格式:ZIP压缩包 内容说明:数据集唯一文件,为压缩归档文件,未提供内部文件结构及字段信息。 数据来源...
-
Max_Planck_Institute_Lexibank_Based_语言词汇特征预计算完整数据
2025年12月9日 30 17 11
数据集概述 该数据集为Lexibank²项目的预计算特征数据,版本2.1,包含大规模词汇数据的预计算特征,以压缩包形式存储,用于支持词汇相关的研究与分析。 文件详解 文件名称:lexibank-analysed-v2.1.zip 文件格式:ZIP压缩包...
-
图卡诺语系Desano_Siriano_Yupua分支语音重建与分类数据集
2025年12月7日 30 88 19
数据集概述 该数据集收录了来自Koch-Grünberg(1914)和Huber and Reed(1992)的词汇,通过历史比较法重建原始语言的语音系统,涉及Desano、Siriano、Yupua、Tanimuka和Yahuna五种语言,重建了四个原始语支,为图卡诺语系分支分类提供语音数据支持。 文件详解...
-
嘉绒语族语言数据库衍生CLDF数据集2013
2025年12月7日 30 21 16
数据集概述 本数据集是基于2013年Nagano和Prins创建的“嘉绒语族语言数据库”(rGyalrongic Languages Database)转换得到的CLDF格式数据集,为嘉绒语族语言研究提供标准化数据支持。 文件详解 文件名称: lexibank/naganorgyalrongic-v3.1.zip 文件格式: ZIP压缩包 内容说明:...
-
缅语族语言词汇数据机器可读集合
2025年12月5日 30 61 27
数据集概述 本数据集包含缅语族语言的词汇列表,大部分词汇已按WordNet进行语义标准化,全面整合了已发表的缅语族语言数据,为缅语族语言词汇研究提供机器可读的基础数据支持。 文件详解 压缩文件集合: burmish.list.zip:词汇列表压缩文件 burmish.table.zip:表格形式的词汇数据压缩文件...
-
词汇数据集Lexicon-CleanDataset-jvmchik
2025年4月24日 30 94 40
词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。...
-
孟加拉语词汇数据集-公交玛玛项目-rafsun
2025年4月23日 30 128 5
孟加拉语词汇数据集-公交玛玛项目-rafsun 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,NLP,公交玛玛,学生出行,聊天机器人,词汇数据 数据概述: 本数据集是为公交玛玛项目中的聊天机器人功能而收集,旨在支持孟加拉语的交流,方便学生公交出行。数据集包含六种类型的数据,具体如下: stop_words:停用词,共385个...
-
多语言词汇数据集WordswithLanguagesDataset-mansigarg18
2025年4月22日 30 16 15
多语言词汇数据集WordswithLanguagesDataset-mansigarg18 数据来源:互联网公开数据 标签:语言学习,词汇数据,数据集,自然语言处理,教育技术,多语言,语言学,数据挖掘 数据概述: 该数据集包含来自多种语言词汇的数据,记录了不同语言中的常见词汇及其相关信息。主要特征如下:...



