找到35个数据集

标签: 语言分类

过滤结果
  • Kam_kdx_Lesage非洲语言词汇表数据2019

    2026年1月31日 30 134 133

    数据集概述 本数据集包含Kam语言(ISO 639-3: kdx;Glottocode: kamm1249)的词汇表,该语言属于尼日尔-刚果语系,主要分布在尼日利亚中东部,分类较困难。数据可作为RefLex资源的引用来源,当前仅提供词形、释义和词类信息,未来将发布包含音系和语法介绍的完整版词典。 文件详解...
    packageimg
  • Nicobarese_Source语言系统发育分析词表数据2021

    2026年1月27日 30 69 58

    数据集概述 本数据集基于改良的Swadesh 100词表,用于分析尼科巴语支的内部语言分支关系。尼科巴语支包含约七种语言,多数仅部分记录,仅两种语言有详细词典和语法描述,数据处理难度较高。数据集支持作者2021年在瑞典隆德ICAAL会议发表的论文及后续版本。 文件详解 文件名称:Nicobarese 100 lexicon+Nexus.xlsx...
    packageimg
  • Phlorest_Based_Pama_Nyungan语言系统发育树数据

    2026年1月22日 30 46 4

    数据集概述 本数据集是基于Bouckaert等人2018年发表的《澳大利亚Pama-Nyungan语言的起源与扩张》研究生成的Phlorest系统发育树数据,用于记录和分析澳大利亚Pama-Nyungan语言的演化关系,为语言学研究提供结构化的系统发育参考。 文件详解 文件名称:phlorest/bouckaert_et_al2018-v1.1.zip...
    packageimg
  • Phlorest_Based_Pama_Nyungan语言系统发育分析数据集2012

    2026年1月18日 30 28 7

    数据集概述 本数据集为基于Bowern & Atkinson 2012年研究的Phlorest系统发育树数据,核心内容是Pama-Nyungan语言的内部结构计算系统发育分析结果,用于支持语言演化和分类研究,数据集包含1个压缩文件。 文件详解 文件名称:phlorest/bowern_and_atkinson2012-v1.1.zip...
    packageimg
  • Ethiosemitic_Based埃塞俄比亚闪米特语言分类与决定因素数据集2021

    2026年1月18日 30 150 62

    数据集概述 本数据集是基于Feleke 2021年研究“Ethiosemitic languages: classifications and classification determinants”构建的CLDF格式数据集,包含埃塞俄比亚闪米特语言的分类及分类决定因素相关数据,为语言分类研究提供结构化资源。 文件详解 压缩文件...
    packageimg
  • Supplementary_material_5_Based_古东斯拉夫与现代斯拉夫语言距离测量实验结果数据

    2025年12月28日 30 67 1

    数据集概述 本数据集是基于语料库的语言距离测量实验结果,涵盖古东斯拉夫、现代东斯拉夫及现代标准斯拉夫语言变体。包含240个实验文件夹及1个汇总CSV文件,实验参数涉及主题反建模启发式、 Sørensen-Dice系数归一化、混合度量策略等,现代标准斯拉夫数据集还按不同规模占比(0.1、0.3、0.6、1)重复实验。 文件详解 汇总文件...
    packageimg
  • Jackknifing_the_Black_Sheep论文附录_ASJP分类性能与南岛语系数据集

    2025年12月22日 30 169 121

    数据集概述 本数据集包含《Jackknifing the Black Sheep》论文的两个附录,聚焦ASJP分类性能与南岛语系语言研究,涵盖南岛语系语言树状图及1137种语言变体的分类与参数数据。 文件详解 文件名称:Appendix1_AustronesianTree.pdf 文件格式:PDF 内容:南岛语系语言的ASJP树状图,呈现语言谱系关系...
    packageimg
  • 南岛语系语言关系模型支持数据集

    2025年12月22日 30 61 47

    数据集概述 本数据集是Smith《晚期马来-波利尼西亚语:南岛语系语言关系新模型》一文的配套表格数据,用于支持文章中的分析。原计划作为附录置于文末,为提升文章可读性移至此处。 文件详解 文件名称: LMP.appendices.pdf 文件格式: PDF (.pdf) 内容描述: 包含原计划作为文章附录的表格数据及相关说明 文件名称:...
    packageimg
  • 图皮_瓜拉尼语系系统发育分类CLDF数据集2021

    2025年12月21日 30 199 118

    数据集概述 该数据集是基于2021年Gerardi和Reichert关于《图皮-瓜拉尼语系:系统发育分类》研究的CLDF格式数据,用于语言学领域中图皮-瓜拉尼语系的系统发育分析,为语系分类研究提供标准化数据支持。 文件详解 文件名称:gerarditupi-v2.1.zip 文件格式:ZIP压缩包(.zip) 存储目录:lexibank/...
    packageimg
  • 基于Lieberherr和Bodt_科博瓦语比较词表_的CLDF数据集2017

    2025年12月21日 30 93 13

    数据集概述 该数据集是基于2017年Lieberherr和Bodt研究的"科博瓦语比较词表"转换的CLDF格式数据集,包含科博瓦语核心词汇数据,支持语言比较与分类研究。 文件详解 文件名称:lexibank/lieberherrkhobwa-v2.1.zip 文件格式:ZIP压缩包...
    packageimg
  • 语言列表数据集

    2025年12月21日 30 176 63

    数据集概述 本数据集包含一个PDF格式的语言列表文档,核心内容围绕语言相关信息展开,为语言研究或参考提供基础资料支持。 文件详解 文件名称: Language List.pdf 文件格式: PDF 内容说明: 包含语言相关信息的列表文档 适用场景 语言学基础研究: 作为语言名称或分类的参考资料 语言教育资源: 用于语言学习或教学中的词汇列表参考...
    packageimg
  • 昂库语族初步调查数据集

    2025年12月18日 30 152 55

    数据集概述 本数据集围绕昂库语族(属于南亚语系孟高棉语支)展开初步调查,包含未记录语言的词汇、语音数据及地理分布信息,为研究该语族分类、语言特征及演化提供基础资料。 文件详解 文件名称:AngkuicComparative.xlsx 文件格式:Excel(.xlsx) 内容说明:可能包含昂库语族不同语言的词汇比较数据表 文件名称:Angkuic2...
    packageimg
  • 所罗门群岛语言内部分类CLDF数据集1983

    2025年12月18日 30 191 115

    数据集概述 该数据集是基于Tryon和Hackman1983年发表的《Solomon Islands Languages: An internal classification》构建的CLDF格式数据集,包含所罗门群岛语言的内部分类相关数据,为语言分类研究提供支持。 文件详解 文件名称:lexibank/tryonsolomon-v3.1.zip...
    packageimg
  • Max_Planck_Glottolog_Based_语言数据库5_2_1完整数据

    2025年12月10日 30 46 25

    数据集概述 该数据集为Glottolog语言数据库5.2.1版本,由Hammarström等学者编纂,是一个系统性记录全球语言信息的专业数据库,为语言学研究提供标准化的语言分类与基础信息支持。 文件详解 文件名称:glottolog-v5.2.1.zip 文件格式:ZIP压缩包(.zip) 内容说明:压缩包内包含Glottolog...
    packageimg
  • 基于Satterthwaite_Phillips2011年藏缅语系语言系统发育推断的CLDF数据集

    2025年12月15日 30 96 37

    数据集概述 该数据集是基于Satterthwaite-Phillips2011年关于藏缅语系语言系统发育推断的研究生成的CLDF格式数据集,包含相关语言演化分析的核心数据,为藏缅语系语言分类研究提供支持。 文件详解 文件名称:lexibank/satterthwaitetb-v4.0.zip 文件格式:ZIP压缩包...
    packageimg
  • Glottolog数据库5_2_1_CLDFF格式数据集

    2025年12月15日 30 141 58

    数据集概述 该数据集为Glottolog数据库5.2.1版本的CLDF格式归档文件,包含语言研究相关数据,由Max Planck Institute for Evolutionary Anthropology发布,可通过指定链接获取。 文件详解 文件名称: glottolog-cldf-v5.2.1.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • CLDF格式南钦语语言笔记数据集1988

    2025年12月14日 30 209 18

    数据集概述 该数据集为CLDF格式,源自1988年Helga So-Hartmann发表的《南钦语语言笔记》,收录了南钦语相关语言学研究内容,为南钦语语言特征分析提供结构化数据支持。 文件详解 文件名称:lexibank/sohartmannchin-v3.1.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • Alor_Pantar语言家族内部分类CLDF数据集2012

    2025年12月12日 30 166 110

    数据集概述 本数据集是基于Robinson和Holton 2012年发表的研究,采用计算方法对Alor-Pantar语言家族词汇进行内部分类的CLDF格式数据集,为语言家族分类研究提供标准化数据支持。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: lexibank/robinsonap-v4.1.zip - 文件格式:...
    packageimg
  • 越南苗瑶语系Na_Meo语言分类数据集

    2025年12月11日 30 148 91

    数据集概述 本数据集围绕越南苗瑶语系Na Meo语言的分类研究展开,包含田野调查收集的词汇数据、对比分析材料及研究成果文档,为验证Na Meo归属黔东苗语分支及探究其迁徙起源提供数据支持。 文件详解 研究文档: The_classification_of_Na_Meo_PPT.pdf: PDF格式,可能为研究内容的PPT演示文档...
    packageimg
  • 基于Marrison1967年_印度东北部那加语言_的CLDF数据集

    2025年12月10日 30 149 148

    数据集概述 该数据集是基于Marrison1967年《印度东北部那加语言》的CLDF格式数据集,核心内容为印度东北部那加语言的分类相关数据,以压缩包形式存储。 文件详解 文件名称:lexibank/marrisonnaga-v3.1.zip 文件格式:ZIP压缩包 内容说明:数据集唯一文件,为压缩归档文件,未提供内部文件结构及字段信息。 数据来源...
    packageimg