找到51个数据集

标签: 语言多样性

过滤结果
  • 探索欧盟国家网站的英语主导地位研究数据

    2026年2月9日 30 196 62

    数据集概述 本数据集包含欧盟国家网站英语使用情况研究的相关指标和累积信息,对应研究论文的方法、结果与讨论部分内容。数据集共24个文件,主要记录欧盟各国网站的语言使用数据及相关计算指标,支持对英语在欧盟国家网站中主导地位的分析。 文件详解 国家域名数据文件...
    packageimg
  • CLDF_Based_南美低地语言比较词表数据集2024

    2026年1月30日 30 205 15

    数据集概述 本数据集为CLDF格式,源自Blum等人2024年的研究,包含用于探究南美低地语言间远亲关系的比较词表。数据以压缩包形式存储,可支持语言亲缘关系分析、词汇比较研究等应用。 文件详解 压缩包文件 文件名称:pano-tacanan-history/blumpanotacana-v1.2.zip 文件格式:ZIP...
    packageimg
  • CLDF_Ivani_Suansu基础词汇数据集2019

    2026年1月30日 30 85 30

    数据集概述 本数据集是基于Ivani 2019年关于印度东北部藏缅语族语言Suansu的基础词汇研究形成的CLDF格式数据集,核心内容为Suansu语言的基础词汇信息,为语言研究提供结构化资源。 文件详解 文件名称:lexibank/ivanisuansu-v2.0.zip 文件格式:ZIP...
    packageimg
  • CLDF_JIPA_Based_IPA期刊音位清单数据集2021

    2026年1月28日 30 25 5

    数据集概述 本数据集为CLDF格式,包含从《国际语音协会期刊》(Journal of the IPA)中提取的音位清单数据,由Baird等人于2021年整合。数据基于《北风与太阳》文本采样,可用于语言学领域中音位系统的研究与分析,共包含一个压缩文件。 文件详解 文件名称:cldf-datasets/jipa-v1.0.zip 文件格式:ZIP...
    packageimg
  • SAILS_2014_Based_南美原住民语言结构在线数据_存档

    2026年1月27日 30 145 70

    数据集概述 本数据集为2014年发布的“南美原住民语言结构(SAILS)在线”项目数据,包含南美原住民语言的结构信息,由马克斯·普朗克进化人类学研究所发布,以压缩包形式提供,仅含一个文件。 文件详解 文件名称:sails-v2014.zip 文件格式:ZIP(压缩包)...
    packageimg
  • Deepadung_Based_Palaung方言词汇比较数据集v1_3

    2026年1月22日 30 111 94

    数据集概述 本数据集源自Deepadung等人2015年发表的《中缅泰Palaung方言词汇比较》研究,以CLDF格式整理了Palaung方言的词汇对比数据,包含中国、缅甸、泰国三地Palaung方言的词汇信息,为语言多样性研究提供结构化资源。 文件详解 压缩包文件 文件名称:lexibank/deepadungpalaung-v1.3.zip...
    packageimg
  • Phlorest_Based_Pama_Nyungan语言系统发育树数据

    2026年1月22日 30 37 2

    数据集概述 本数据集是基于Bouckaert等人2018年发表的《澳大利亚Pama-Nyungan语言的起源与扩张》研究生成的Phlorest系统发育树数据,用于记录和分析澳大利亚Pama-Nyungan语言的演化关系,为语言学研究提供结构化的系统发育参考。 文件详解 文件名称:phlorest/bouckaert_et_al2018-v1.1.zip...
    packageimg
  • East_Caucasian_Based_东高加索村庄地理语言数据2021

    2026年1月21日 30 2 0

    数据集概述 本数据集包含东高加索地区的村庄列表,记录了村庄的坐标、使用语言及方言归属信息,方言归属基于现有文献及部分专家个人交流整理而成。数据通过单个文件呈现,为研究该地区语言地理分布提供基础信息。 文件详解 文件名称:villages_oct2021.xlsx 文件格式:XLSX...
    packageimg
  • Phlorest_Based_Pama_Nyungan语言系统发育分析数据集2012

    2026年1月18日 30 113 11

    数据集概述 本数据集为基于Bowern & Atkinson 2012年研究的Phlorest系统发育树数据,核心内容是Pama-Nyungan语言的内部结构计算系统发育分析结果,用于支持语言演化和分类研究,数据集包含1个压缩文件。 文件详解 文件名称:phlorest/bowern_and_atkinson2012-v1.1.zip...
    packageimg
  • Hunter_Gatherer_Based_语言数据库衍生CLDF数据集_2021版

    2026年1月18日 30 124 12

    数据集概述 本数据集是基于Bowern等人2021年的《Hunter-Gatherer Language Database》生成的CLDF格式数据集,包含1个压缩文件,旨在为语言学研究提供结构化的狩猎采集者语言相关数据,便于跨研究场景的复用与分析。 文件详解 压缩文件 文件名称:lexibank/huntergatherer-v2.1.zip...
    packageimg
  • lexibank_Based_手语传播进化动力学研究CLDF数据集_v1_0_2

    2026年1月15日 30 91 79

    数据集概述 本数据集是CLDF格式的压缩包文件,为研究“手语传播的进化动力学”提供支持。数据来自lexibank项目,包含1个压缩文件,未划分训练/测试集或原始/处理数据,整体结构简洁,便于语言学领域的相关研究使用。 文件详解 压缩文件 文件名称:lexibank/powerma-v1.0.2.zip 文件格式:ZIP...
    packageimg
  • Oceanic_barriers_Based日本群岛海洋屏障语言多样性量化研究数据

    2026年1月15日 30 91 28

    数据集概述 本数据集为验证地理屏障对语言多样性影响的研究辅助数据,支持量化分析日本群岛海洋屏障对词汇多样性的作用。研究采用进化生物学方法,通过基础词汇β多样性测量,结合地理邻近性与海洋隔离因素,揭示海洋屏障对日本语言词汇变异的独立解释力,并验证结果可推广至阿伊努语系。 文件详解 文件名称:SI.xlsx 文件格式:XLSX...
    packageimg
  • Papuan_Voices_Supplement_巴布亚岛屿语音录音媒体文件补充数据集

    2026年1月14日 30 130 38

    数据集概述 本数据集是Papuan Voices数据集的补充,包含巴布亚岛各地语音录音的媒体文件。数据以压缩包形式提供,内含按文件名首两位字符分类的音频文件夹,每个音频文件对应主数据集的ID,可辅助语音转录研究。 文件详解 README.md 文件格式:MD...
    packageimg
  • CLDF_Based_South_American_Languages_Borrowing研究数据集2023

    2025年12月28日 30 97 89

    数据集概述 本数据集是Miller和List在2023年发表的《South American Languages Borrowing》研究的配套CLDF数据集,包含1个压缩文件,用于支持对南美洲语言词汇借用现象的检测与分析研究,文件存储于单层目录结构中。 文件详解 压缩文件 文件名称:lexibank/sabor-v1.0.zip 文件格式:ZIP...
    packageimg
  • 东印度尼西亚语言LexiRumah数据库v3_0_1

    2025年12月22日 30 67 55

    数据集概述 该数据集是东印度尼西亚语言的LexiRumah数据库,版本为v3.0.1。以压缩包形式存储,包含相关语言数据,为研究东印度尼西亚语言提供数据支持。 文件详解 文件名称:lessersunda/lexirumah-data-v3.0.1.zip 文件格式:ZIP(.zip)...
    packageimg
  • 多语言数字人文社区六类用户画像

    2025年12月22日 30 207 11

    数据集概述 本数据集包含六个虚构的用户画像文档,基于2020年6月开展的现状调查数据构建。该调查是伦敦国王学院主办的“打破数字单语主义研讨会”中“数字知识基础设施中的语言与地理文化多样性”专题组的研究内容,画像曾作为补充材料附于DH Unbound 2022会议替代会议论文。 文件详解 文件名称:...
    packageimg
  • 乌拉尔语系地理数据库

    2025年12月21日 30 81 35

    数据集概述 该数据集包含乌拉尔语系过去与当前分布的原始数字空间数据集及最终地图。数据由多机构资助的跨学科团队联合乌拉尔语专家收集,以矢量数据可视化语言分布,支持空间语言学及多学科研究,直观呈现乌拉尔语系及其方言的研究现状。 文件详解 文件名称:Geographical database of the Uralic languages.zip...
    packageimg
  • 基于Lieberherr和Bodt_科博瓦语比较词表_的CLDF数据集2017

    2025年12月21日 30 191 4

    数据集概述 该数据集是基于2017年Lieberherr和Bodt研究的"科博瓦语比较词表"转换的CLDF格式数据集,包含科博瓦语核心词汇数据,支持语言比较与分类研究。 文件详解 文件名称:lexibank/lieberherrkhobwa-v2.1.zip 文件格式:ZIP压缩包...
    packageimg
  • 语言列表数据集

    2025年12月21日 30 9 4

    数据集概述 本数据集包含一个PDF格式的语言列表文档,核心内容围绕语言相关信息展开,为语言研究或参考提供基础资料支持。 文件详解 文件名称: Language List.pdf 文件格式: PDF 内容说明: 包含语言相关信息的列表文档 适用场景 语言学基础研究: 作为语言名称或分类的参考资料 语言教育资源: 用于语言学习或教学中的词汇列表参考...
    packageimg
  • 阿拉瓦克语言多样性CLDF数据集2019

    2025年12月20日 30 82 57

    数据集概述 本数据集为基于Chacon等人2019年研究的CLDF格式数据,内容围绕20世纪50年代录音资料中的阿拉瓦克语言多样性展开,聚焦里奥内格罗上游地区的语言记录与分析。 文件详解 文件名称: lexibank/chaconbaniwa-v2.1.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg