找到58个数据集

标签: 语言保护

过滤结果
  • 萨米语_s_后缀动词派生词研究数据

    2026年2月15日 30 154 120

    数据集概述 本数据集是萨米语中带-s-(-šš-)后缀的动词派生词表格,以表格形式呈现各萨米语支中已证实的派生词。基础词默认以北萨米语形式给出,包含芬兰语或来源文献所用语言的近似含义,适用时标注Eliel Lagercranz《拉普兰词汇》(1939)的对应条目编号。数据集含3个文件。 文件详解 文件名称:South-Saami-esjidh.xlsx...
    packageimg
  • 人类语言资源库_基于博罗罗语的词汇数据库存档文件

    2026年2月1日 30 83 79

    数据集概述 本数据集为Bororoan词汇数据库,包含一个压缩文件,属于tupian-language-resources目录下的语言资源,未提供具体描述,文件类型单一为压缩包。 文件详解 文件名称:bororo-v0.9.5.zip 文件格式:ZIP 字段映射介绍:压缩包文件,包含Bororoan词汇数据库相关内容,具体内部结构及字段信息未提供预览。...
    packageimg
  • dictionaria_kalamang_语言词典数据

    2026年1月31日 30 101 71

    数据集概述 本数据集为Kalamang语言词典,由Visser, Eline于2020年发布,属于Dictionaria系列第13卷,内容涵盖1-2737页。数据以压缩包形式提供,是研究Kalamang语言的重要资源。 文件详解 文件名称:dictionaria/kalamang-v1.2.zip 文件格式:ZIP...
    packageimg
  • Kam_kdx_Lesage非洲语言词汇表数据2019

    2026年1月31日 30 129 58

    数据集概述 本数据集包含Kam语言(ISO 639-3: kdx;Glottocode: kamm1249)的词汇表,该语言属于尼日尔-刚果语系,主要分布在尼日利亚中东部,分类较困难。数据可作为RefLex资源的引用来源,当前仅提供词形、释义和词类信息,未来将发布包含音系和语法介绍的完整版词典。 文件详解...
    packageimg
  • Caucalex_Based_高加索52语言词汇数据集1_0

    2026年1月29日 30 117 57

    数据集概述 本数据集为Caucalex 1.0,包含高加索地区52种语言的词汇数据,覆盖卡尔特维利语系、纳赫-达吉斯坦语系、西北高加索语系、印欧语系和突厥语系五大语言家族,是研究高加索语言词汇特征的基础资料。 文件详解 文件名称:Caucalex 1.0.xlsx 文件格式:XLSX...
    packageimg
  • Saami_Based萨米语始动动词衍生类型表格数据_附录版

    2026年1月29日 30 63 47

    数据集概述 本数据集为萨米语始动动词研究的附录表格,记录各萨米语中基础动词衍生的始动动词类型及出现情况。基础动词以原始萨米语形式呈现,并附有芬兰语近似释义,包含一个Excel文件,是萨米语动词形态学研究的核心参考数据。 文件详解 文件名称:inkoatiivien-koonti.xlsx 文件格式:XLSX...
    packageimg
  • La_Pola_Siero_阿斯图里亚斯地图第2问方言语料数据

    2026年1月29日 30 45 19

    数据集概述 本数据集为阿斯图里亚斯地图第2问相关的La Pola Siero方言语料,包含一份文档文件,聚焦该方言在特定问题场景下的语言表达,为方言研究提供原始语料支持。 文件详解 文件名称:Mapa de Asturias.Pregunta2.docx 文件格式:DOCX...
    packageimg
  • Central_Loloish_Based_语言词汇同言线数据库

    2026年1月28日 30 100 33

    数据集概述 本数据集为Central Loloish(Ngwi)语言的潜在词汇同言线数据库,聚焦该语系语言中的词汇同言线现象,提供结构化数据支持语言学研究。数据集包含1个文件,无目录层级划分,未区分训练/测试、数据/标签或原始/处理数据。 文件详解 文件名称:Central_Loloish_lexical_isogloss_database.xlsx...
    packageimg
  • SAILS_2014_Based_南美原住民语言结构在线数据_存档

    2026年1月27日 30 6 0

    数据集概述 本数据集为2014年发布的“南美原住民语言结构(SAILS)在线”项目数据,包含南美原住民语言的结构信息,由马克斯·普朗克进化人类学研究所发布,以压缩包形式提供,仅含一个文件。 文件详解 文件名称:sails-v2014.zip 文件格式:ZIP(压缩包)...
    packageimg
  • Álgu_Based_Ume_Saami词汇数据现代化拼写转换数据

    2026年1月27日 30 191 31

    数据集概述 本数据集包含源自Schlachter 1958版Ume Saami词典的多版处理数据,从Álgu数据库获取并与原始词典核对词头变体,将词头机械转换为近似现代Ume Saami正字法(参考Barruk 2018)。提供字母化列表及反向字母化文件,含3个文件,支持词汇研究与语言保护。 文件详解 压缩文件(ume-MalaLpW-mod.zip)...
    packageimg
  • Ume_Saami_Dictionary_Comparison_Data

    2026年1月22日 30 132 81

    数据集概述 本数据集为书评《A new general dictionary of Ume Saami》的配套表格,展示Schlachter 1958年与Barruk 2018年版Ume萨米语词典的差异。数据对齐两版词典中以v开头的词条,呈现词汇的共性与差异,支持语言词汇演变研究。 文件详解 文件名称:ume-MalaLpW-Barruk-...
    packageimg
  • Phlorest_Based_Pama_Nyungan语言系统发育分析数据集2012

    2026年1月18日 30 47 14

    数据集概述 本数据集为基于Bowern & Atkinson 2012年研究的Phlorest系统发育树数据,核心内容是Pama-Nyungan语言的内部结构计算系统发育分析结果,用于支持语言演化和分类研究,数据集包含1个压缩文件。 文件详解 文件名称:phlorest/bowern_and_atkinson2012-v1.1.zip...
    packageimg
  • Paĩ_Tavyterã_语言田野调查_名词动词词干提取数据2017_01_02

    2026年1月15日 30 122 28

    数据集概述 本数据集为巴拉圭Amambay地区Paĩ Tavyterã Guarani语言的田野调查数据,核心内容是该语言名词和动词词干的提取结果,仅包含一个文件,无目录结构和数据拆分。 文件详解 文件名称:PTA_2017_01_02.xlsx 文件格式:XLSX 字段映射介绍:因无内容预览,推测包含Paĩ Tavyterã...
    packageimg
  • Wangerooge_Frisian_Based_已灭绝东弗里斯兰语录音转录数据集

    2026年1月15日 30 170 153

    数据集概述 本数据集包含已灭绝的东弗里斯兰语——Wangerooge弗里斯兰语的转录录音资料,总时长34分钟。录音于1924-1927年采集,涉及4位母语使用者,2024-25年完成转录,提供音频及对应的文本转录与英文翻译,是该濒危语言研究的重要资料。 文件详解 压缩包文件(Archive files) 文件名称:包括rec-br-...
    packageimg
  • Yucatec_Maya_Dialect_Atlas_墨西哥尤卡坦半岛方言调查数据集

    2026年1月14日 30 115 31

    数据集概述 本数据集为墨西哥尤卡坦自治大学创建的“Yucatec Maya方言地图集”,记录2000-2007年在尤卡坦半岛80个地点对157名Yucatec Maya语使用者的方言调查结果,基于含665个西班牙语提示的问卷采集,包含1个文件。 文件详解 文件名称:YUC-DTA-REPOSITORY.xlsx 文件格式:XLSX...
    packageimg
  • CLDF_Dogon_Comparative_Wordlist_语言比较研究数据集2016

    2026年1月13日 30 50 35

    数据集概述 本数据集是基于Heath等人2016年的《Dogon Comparative Wordlist》衍生的CLDF格式数据集,由Moran、Forkel和Heath编辑,记录Dogon语言的比较词表信息,为语言学研究提供结构化数据支持。 文件详解 文件名称:heathdogon-v0.3.zip 文件格式:ZIP...
    packageimg
  • LanguageStructure_Xavante_dicionario_葡萄牙语词典合并数据

    2026年1月11日 30 117 43

    数据集概述 本数据集为Xavante语与葡萄牙语的双语词典数据,包含词典内容的合并处理结果,涉及内容修正与音频添加等优化工作,以单一JSON文件形式呈现,可用于语言翻译、词典研究等场景。 文件详解 文件名称:xavante_dictionary_merged.json 文件格式:JSON...
    packageimg
  • dictionaria_Based_La_Ventosa_Diidxaza植物词汇词典数据_v1_3

    2026年1月3日 30 12 11

    数据集概述 本数据集为2018年发布的La Ventosa Diidxazá植物词汇词典,收录Diidxazá语言中与植物相关的词汇及释义,是Dictionaria项目的第5部分成果,共952页,提供在线访问资源。 文件详解 文件名称:dictionaria/diidxaza-v1.3.zip 文件格式:ZIP 字段映射介绍:压缩包包含La...
    packageimg
  • Dictionaria_Daakaka_Based_达卡卡语言词典研究完整数据

    2025年12月24日 30 138 2

    数据集概述 该数据集为Daakaka语言词典数据,包含由Kilu Prince于2017年发布的《Daakaka dictionary》内容,是Dictionaria项目的一部分,为研究Daakaka语言提供基础词典资料。 文件详解 文件名称: dictionaria/daakaka-v1.3.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 杜洪比语引出笔记数据集

    2025年12月22日 30 96 94

    数据集概述 本数据集包含《杜洪比语语法》(Brill,2019)相关的引出笔记PDF文件,配有原始音频文件(DOI 10.5281/zenodo.1406852)。引出会话主要使用仓洛语和杜洪比语,笔记中的分析内容与最终语法描述可能存在差异。 文件详解...
    packageimg