找到590个数据集

标签: 语言学研究

过滤结果
  • 文章提及语言及其ISO代码列表_延续循环

    2025年12月4日   

    数据集概述 本数据集为单一PDF文件,内容是文章《延续循环》中提及的语言及其对应的ISO代码列表,为语言相关研究或应用提供标准化编码参考。 文件详解 文件名称:The_languages_mentioned_in_the_article_Continuative Cycle_with_thei_ ISO_codes.pdf 文件格式:PDF...
    packageimg
  • 闽南语语音词汇及发音数据集

    2025年9月27日   

    闽南语语音词汇及发音数据集_Min_Nan_Language_Speech_Vocabulary_and_Pronunciation_Dataset 数据来源:互联网公开数据 标签:闽南语,语音识别,语言学,发音,词汇,语音,语料库,声学模型 数据概述:...
    packageimg
  • JASPER语音语料库数据集

    2025年6月4日   

    JASPER语音语料库数据集 数据来源:互联网公开数据 标签:语音语料库,日本语速,发音错误识别,母语者,慢速,中速,快速,语音处理,语言学研究 数据概述: 本数据集是JASPER语音语料库(Japanese Speaking Rate...
    packageimg
  • 青空文庫日文文学语料库数据集

    2025年6月4日   

    青空文庫日文文学语料库数据集 数据来源:互联网公开数据 标签:日文文学,语料库,文本分析,自然语言处理,教育,文化研究 数据概述: 本数据集是将青空文庫(Aozora Bunko)中收录的日本文学文本编译成更易于使用的CSV格式。包含的经典文学作品涵盖了多个历史时期,为研究日文文本提供了丰富的资源。数据集旨在为研究日文写作和语言学项目提供基础数据支持。...
    packageimg
  • 梵文关系数据集

    2025年6月1日   

    梵文关系数据集 数据来源:互联网公开数据 标签:梵文,句法分析,语料库,关系数据,NLP,语言学研究,文本分析 数据概述: 本数据集基于CoNLL-U格式文件构建,将原始的结构化文本数据转换为关系型数据格式,并存储为 Feather 文件以提高数据处理的效率和灵活性。数据集包含两个主要文件:words.feather 和...
    packageimg
  • 圣经多语言平行语料库

    2025年5月31日   

    圣经多语言平行语料库 数据来源:互联网公开数据 标签:多语言,平行语料库,圣经翻译,语言对比,机器翻译,语言学研究,跨文化交流 数据概述: 本数据集是一个多语言平行语料库,由Christos Christodoulopoulos和Mark...
    packageimg
  • 多语言语音转录数据集

    2025年5月31日   

    多语言语音转录数据集 数据来源:互联网公开数据 标签:多语言,语音识别,说话人识别,语音转录,语言学研究,年龄分布,性别分布,口音分析,社会语言学 数据概述:...
    packageimg
  • 印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi

    2025年5月29日   

    印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:...
    packageimg
  • 韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo

    2025年5月28日   

    韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:...
    packageimg
  • 越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy

    2025年5月19日   

    越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy 数据来源:互联网公开数据 标签:机器翻译, 语言学, 越南语, 高棉语, 语料库, 平行语料, 文本翻译, 自然语言处理 数据概述: 该数据集包含越南语和高棉语的平行文本,旨在为机器翻译、跨语言研究等任务提供支持。主要特征如下:...
    packageimg
  • 卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16

    2025年5月18日   

    卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16 数据来源:互联网公开数据 标签:多语言,卡纳达语,英语,数据集,自然语言处理,机器翻译,语言学研究,文本分析 数据概述: 该数据集包含卡纳达语与英语的多语言文本数据,记录了两种语言之间的文本对齐信息。主要特征如下:...
    packageimg
  • 古兰经注释数据集Quran-TahberDataset-eslamsalah123

    2025年5月15日   

    古兰经注释数据集Quran-TahberDataset-eslamsalah123 数据来源:互联网公开数据 标签:古兰经,注释,宗教研究,文本分析,文化研究,伊斯兰教,数据集,语言学 数据概述: 该数据集包含来自多种来源的古兰经注释,记录了古兰经各个章节和节文的详细注释内容。主要特征如下:...
    packageimg
  • 法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd

    2025年5月14日   

    法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd 数据来源:互联网公开数据 标签:语言学习,数据集,金额表达,法语,教育技术,自然语言处理,机器学习,语言研究 数据概述: 该数据集包含来自公开语料库的法语金额表达数据,记录了法语中不同金额的书面和口语表达方式。主要特征如下:...
    packageimg
  • 斯瓦希里语语料库数据集-kariukiandrew

    2025年5月11日   

    斯瓦希里语语料库数据集-kariukiandrew 数据来源:互联网公开数据 标签:斯瓦希里语,语料库,自然语言处理,文本分析,语言学,机器翻译,文本挖掘,非洲语言 数据概述: 该数据集包含斯瓦希里语文本语料,旨在为自然语言处理和语言学研究提供资源。主要特征如下: 时间跨度:数据涵盖不同时期和来源的斯瓦希里语文本。...
    packageimg
  • 南非北部索托语文本对齐数据集NorthernSothoTextAlignmentDataset-girlyphaladi

    2025年5月1日   

    南非北部索托语文本对齐数据集NorthernSothoTextAlignmentDataset-girlyphaladi 数据来源:互联网公开数据 标签:文本对齐, 机器翻译, 语言学, 南非语, 语料库, 自然语言处理, 文本分析, 语言资源 数据概述: 该数据集包含来自南非北部索托语的文本对齐数据,记录了不同语句在语料库中的对应关系。主要特征如下:...
    packageimg
  • 曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill

    2025年5月1日   

    曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 语言对, 曼西语, 俄语, 语料库, 自然语言处理 数据概述: 该数据集包含曼西语和俄语的双语平行文本,旨在为机器翻译、语言研究等领域提供数据支持。主要特征如下:...
    packageimg
  • 摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien

    2025年4月29日   

    摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien 数据来源:互联网公开数据 标签:机器翻译, 口语, 语言学, 文本翻译, 摩洛哥, 法语, 对比分析, 语料库 数据概述:...
    packageimg
  • 世界语言家族地图数据集

    2025年4月27日   

    世界语言家族地图数据集 数据来源:互联网公开数据 标签:语言家族,地理分布,语言学研究,语言多样性,学术资源 数据概述: 本数据集基于Glottolog...
    packageimg
  • 中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal

    2025年4月26日   

    中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:...
    packageimg
  • 电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86

    2025年4月26日   

    电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:...
    packageimg