找到628个数据集

标签: 机器翻译

过滤结果
  • 泰米尔语-问答数据集

    2025年4月15日   

    泰米尔语-问答数据集 数据来源:互联网公开数据 标签:泰米尔语,问答系统,自然语言处理,NLP,机器翻译,QA挑战,斯坦福SQuAD 数据概述: 本数据集是为Chaii Hindi和泰米尔语问答挑战(Chaii Hindi and Tamil QA...
    packageimg
  • 福尔摩斯的矛盾增强数据集1963-2021

    2025年4月15日   

    福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:...
    packageimg
  • 波斯语文本蕴含推理数据集FarsTail

    2025年4月15日   

    波斯语文本蕴含推理数据集FarsTail 数据来源:互联网公开数据 标签:自然语言处理,文本蕴含,NLI,波斯语,波斯文,Farsi,数据集,机器翻译,语言学 数据概述:...
    packageimg
  • 乌尔都-普什图双语词典数据集

    2025年4月15日   

    乌尔都-普什图双语词典数据集 数据来源:互联网公开数据 标签:乌尔都语,普什图语,双语词典,自然语言处理,机器翻译,语言研究 数据概述: 乌尔都-...
    packageimg
  • 约鲁巴语到英语机器翻译数据集

    2025年4月15日   

    约鲁巴语到英语机器翻译数据集 数据来源:互联网公开数据 标签:约鲁巴语,英语,机器翻译,低资源语言,自然语言处理,数据集,模型训练,多领域应用 数据概述:...
    packageimg
  • 英语-印地语句子数据集

    2025年4月14日   

    英语-印地语句子数据集 数据来源:互联网公开数据 标签:英语,印地语,句子翻译,语言学习,文本分析,机器翻译,双语数据集 数据概述: 本数据集包含2718条英语句子及其对应的印地语翻译,旨在为语言学习、文本分析和机器翻译研究提供高质量的双语数据。数据集中的每对句子均经过仔细校对,确保翻译的准确性和一致性。 数据用途概述:...
    packageimg
  • 眼科医学文本双语平行语料库

    2025年4月14日   

    眼科医学文本双语平行语料库 数据来源:互联网公开数据 标签:医学翻译,眼科,平行语料库,双语文本,机器翻译,领域特定数据 数据概述:...
    packageimg
  • 基于GPT-3的改写文章数据集

    2025年4月14日   

    基于GPT-3的改写文章数据集 数据来源:互联网公开数据 标签:GPT-3,文本改写,自然语言处理,摘要,引言,数据增强,机器翻译 数据概述: 本数据集包含由GPT-3语言模型改写的文章标题、摘要和引言部分。原始文章选自Assoc. Prof. Mehmet Erkut Erdem的Google Scholar页面,并通过GPT-3...
    packageimg
  • 埃维语-英语双语对照数据集

    2025年4月14日   

    埃维语-英语双语对照数据集 数据来源:互联网公开数据 标签:埃维语,英语,双语对照,自然语言处理,机器翻译,跨语言研究,文本挖掘 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-

    2025年4月14日   

    斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -...
    packageimg
  • 印地语-英语音译数据集

    2025年4月14日   

    印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-...
    packageimg
  • 摩洛哥阿拉伯语Darija语言任务与平行翻译数据集

    2025年4月14日   

    摩洛哥阿拉伯语Darija语言任务与平行翻译数据集 数据来源:互联网公开数据 标签:摩洛哥阿拉伯语, Darija, 机器翻译, 语言模型, 平行语料库, 自然语言处理, 多语言学习 数据概述:...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日   

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg
  • 僧伽罗语-英语-新加坡英语翻译数据集

    2025年4月14日   

    僧伽罗语-英语-新加坡英语翻译数据集 数据来源:互联网公开数据 标签:僧伽罗语,英语,新加坡英语,翻译数据,语言学习,机器翻译,语言学研究 数据概述: 本数据集包含僧伽罗语、英语和新加坡英语之间的翻译文本,每行记录包括一段僧伽罗语原文及其对应的英语和新加坡英语翻译。数据集结构清晰,便于进行文本分析和处理,为语言研究和翻译技术开发提供了可靠的数据支持。...
    packageimg
  • 印度次大陆嘻哈歌曲创作与语言应用数据集

    2025年4月14日   

    印度次大陆嘻哈歌曲创作与语言应用数据集 数据来源:互联网公开数据 标签:嘻哈,歌词,创意写作,自然语言处理,机器翻译,情感分析,转录,印度,DHH,Desi Hip Hop 数据概述:...
    packageimg
  • Hinglish印地语-英语混合语机器翻译数据集

    2025年4月14日   

    Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish...
    packageimg
  • 小型英语到法语机器翻译数据集

    2025年4月14日   

    小型英语到法语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,英语,法语,自然语言处理,翻译模型,训练数据,语言学习 数据概述:...
    packageimg
  • 神经机器翻译-玉刚数据集

    2025年4月14日   

    神经机器翻译-玉刚数据集 数据来源:互联网公开数据 标签:神经机器翻译,玉刚,语言模型,数据集,机器翻译,自然语言处理,翻译质量评估 数据概述: 本数据集包含约12,000个玉刚语言的 instructional...
    packageimg
  • 沃森翻译增强训练测试数据集

    2025年4月14日   

    沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:...
    packageimg
  • 翻译数学问题数据集

    2025年4月14日   

    翻译数学问题数据集 数据来源:互联网公开数据 标签:数学问题,翻译, Bengali, English, 语言模型, 机器翻译, 取回增强生成, 少样本学习 数据概述:...
    packageimg