找到19个数据集

标签: 语言数据

过滤结果
  • Kpelle_Mano_语半自发话语标注论文补充数据

    2026年1月31日 30 40 19

    数据集概述 本数据集为待评审论文的补充材料,包含Kpelle语和Mano语的半自发话语标注内容,提供一份结构化的语言数据文件,支持相关语言学研究与分析。 文件详解 文件名称:all_data_submission.xlsx 文件格式:XLSX...
    packageimg
  • Grollemund_Bantu_班图语扩张栖息地影响人类迁徙研究数据2015

    2026年1月20日 30 28 0

    数据集概述 本数据集基于Grollemund等人2015年的研究,聚焦班图语扩张过程中栖息地对人类迁徙路线和速度的影响。数据以CLDF格式组织,包含相关语言演化与人类迁徙的关联信息,为研究人类扩散模式提供支持。 文件详解 压缩文件 文件名称:lexibank/grollemundbantu-v1.1.zip 文件格式:ZIP...
    packageimg
  • Sims_Based_Proto_Rma声调历时研究CLDF数据集2020

    2026年1月21日 30 172 126

    数据集概述 本数据集是基于Sims 2020年发表的《Reconsidering the diachrony of tone in Rma》一文生成的CLDF格式数据集,核心内容为Proto-Rma声调历时演变的相关语言数据,为语言学研究提供结构化的声调演变分析基础。 文件详解 文件名称:lexibank/simsrma-v1.3.zip...
    packageimg
  • Glottolog数据库5_2_1_CLDFF格式数据集

    2025年12月15日 30 80 27

    数据集概述 该数据集为Glottolog数据库5.2.1版本的CLDF格式归档文件,包含语言研究相关数据,由Max Planck Institute for Evolutionary Anthropology发布,可通过指定链接获取。 文件详解 文件名称: glottolog-cldf-v5.2.1.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 形态句法区分的不确定性与变异性测量评估补充材料

    2025年12月15日 30 42 5

    数据集概述 本数据集是《语言类型学》期刊相关论文的补充材料,围绕形态句法区分的三个核心问题(边界强度、构成、架构),提供研究使用的原始数据及统计分析(相关矩阵、随机森林、聚类验证)的代码与结果文档,支撑方法论问题的探讨。 文件详解...
    packageimg
  • 语言数据资源链接数据库

    2025年12月10日 30 145 48

    数据集概述 该数据集是一个链接资源数据库,汇集了多个语言学数据库与数据集的访问链接,旨在帮助用户查找符合研究需求的免费语言类网络数据资源。此为最终版本,将不再维护或更新。 文件详解 文件名称:linguistic-data-master.zip 文件格式:ZIP(.zip)...
    packageimg
  • 巴灵骨骼论文补充材料_美拉尼西亚语言与词汇语义关联研究

    2025年12月9日 30 156 129

    数据集概述 本数据集为论文《Baring the bones: the lexico-semantic association of bone with strength in Melanesia and the study of colexification》的补充材料,包含两个附录,聚焦美拉尼西亚语言中“骨骼”与“力量”的词汇语义关联及共现研究。...
    packageimg
  • 恩德贝莱语祖鲁语斯瓦蒂语聪加语科萨语情态可能性数据集2024

    2025年12月8日 30 95 41

    数据集概述 本数据集聚焦恩德贝莱语、祖鲁语、斯瓦蒂语、聪加语、科萨语五种语言的情态可能性研究,包含相关语言数据及附录文档,为非洲语言情态语法分析提供支持。 文件详解 Crane et al 2024 Modal Possibility Appendix B Dataset.pdf:PDF格式文档,可能包含数据集的背景说明、研究方法或补充信息 Crane...
    packageimg
  • D_PLACE项目数据库_地点语言文化与环境数据v2_2_1

    2025年12月7日 30 19 9

    数据集概述 该数据集是D-PLACE项目(地点、语言、文化与环境数据库)的数据仓库,包含与全球各地人类社会相关的地点、语言、文化实践及环境背景的综合数据,为跨学科研究提供基础资料。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: dplace-data-v2.2.1.zip - 文件格式: ZIP压缩包(.zip) - 内容说明:...
    packageimg
  • 信德语文章数据集

    2025年4月27日 30 108 57

    信德语文章数据集 数据来源:互联网公开数据 标签:信德语,自然语言处理,NLP,文本分析,聚类,时间序列,语言数据,文章数据 数据概述:...
    packageimg
  • 达里贾语开放数据集DarijaOpenDataset-youneselbouknify

    2025年4月25日 30 163 130

    达里贾语开放数据集DarijaOpenDataset-youneselbouknify 数据来源:互联网公开数据 标签:达里贾语,语言数据,自然语言处理,数据集,语料库,人工智能,机器学习,语言学 数据概述:该数据集包含来自不同来源的达里贾语(摩洛哥阿拉伯语方言)文本数据,记录了日常对话,新闻报道,社交媒体帖子等多种类型的文本内容。主要特征如下:...
    packageimg
  • 俄罗斯越南语言数据集RussianVietnameseDataset-flightstar

    2025年4月25日 30 104 46

    俄罗斯越南语言数据集RussianVietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,机器翻译,跨语言分析,人工智能,语言研究,文本分析 数据概述: 该数据集包含来自互联网公开资源的俄语和越南语语言数据,记录了两种语言的文本句子对,适用于机器翻译,语言学研究等任务。主要特征如下:...
    packageimg
  • 英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69

    2025年4月23日 30 133 41

    英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言数据,数据集,泰卢固语,英语,自然语言处理,翻译研究,多语言处理 数据概述: 该数据集包含英语到泰卢固语的句子翻译对,记录了大量的双语句子对照数据。主要特征如下:...
    packageimg
  • 英印机器翻译练习数据集-arunmohan003

    2025年4月22日 30 28 14

    英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:...
    packageimg
  • 乌尔都语句子数据集-2023年-sheerazhussain

    2025年4月21日 30 125 13

    乌尔都语句子数据集-2023年-sheerazhussain 数据来源:互联网公开数据 标签:乌尔都语,句子,语言学,文本分析,自然语言处理,语言数据 数据概述: 本数据集包含一小部分乌尔都语句子,适合用于语言学研究、文本分析和自然语言处理任务。数据集中的句子涵盖了乌尔都语的多种语言特征和语法结构,为研究人员提供了基础的语言数据资源。 数据用途概述:...
    packageimg
  • 英语-伊博语圣经数据集

    2025年4月17日 30 71 12

    英语-伊博语圣经数据集 数据来源:互联网公开数据 标签:机器翻译,伊博语,圣经文本,英语,语言数据,语料库,宗教文本 数据概述: 本数据集为英语和伊博语的圣经文本对齐数据,主要用于英语至伊博语的机器翻译研究。数据来源于Jehovah...
    packageimg
  • 英译马拉提语数据集

    2025年4月15日 30 210 15

    英译马拉提语数据集 数据来源:互联网公开数据 标签:英译马拉提,自然语言处理,神经机器翻译,序列到序列,语言数据,翻译技术 数据概述: 本数据集专注于印度语言马拉提语的翻译任务。数据通过网络抓取技术收集,涵盖常用句子和词汇,旨在为英译马拉提语的研究和应用提供基础数据支持。 数据用途概述:...
    packageimg
  • 欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语

    2025年4月14日 30 188 115

    欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据 数据概述: ELRC-...
    packageimg
  • 孟加拉语对话摘要数据集英文翻译

    2025年4月14日 30 40 39

    孟加拉语对话摘要数据集英文翻译 数据来源:互联网公开数据 标签:对话摘要, 孟加拉语, 自然语言处理, 机器翻译, 文本摘要, 语言数据, 翻译数据集 数据概述:...
    packageimg