找到984个数据集

标签: 机器翻译

过滤结果
  • 英语-马拉雅拉姆语言翻译数据集-nihalthomas15

    2025年4月22日   

    英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:...
    packageimg
  • 跨语言问答数据集XQuAD印地语部分2019-nbroad

    2025年4月21日   

    跨语言问答数据集XQuAD印地语部分2019-nbroad 数据来源:互联网公开数据 标签:跨语言问答,自然语言处理,机器翻译,多语言数据集,印地语,文本理解 数据概述: 本数据集是XQuAD(跨语言问答数据集)中的印地语部分,用于评估跨语言问答性能。数据集包含SQuAD v1.1开发集的子集,共有240段落和1190个问题-...
    packageimg
  • 跨语言问答数据集XQuAD多语言问答数据集-thedevastator

    2025年4月21日   

    跨语言问答数据集XQuAD多语言问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答, 跨语言, 自然语言处理, 机器翻译, 文本理解, SQuAD, 语言模型, 英语, 西班牙语, 德语, 希腊语, 俄语, 土耳其语, 阿拉伯语, 越南语, 泰语, 汉语, 印地语 数据概述:...
    packageimg
  • 林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak

    2025年4月21日   

    林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:...
    packageimg
  • 句子间连接数据集

    2025年4月21日   

    句子间连接数据集 数据来源:互联网公开数据 标签:跨语言连接,多语言资源,语言对齐,语料库,NLP研究 数据概述: 本数据集记录了不同语言之间的句子配对,主要来源于Tatoeba项目。数据集包含了多种语言的句子及其对应关系,为研究和开发多语言自然语言处理任务提供了宝贵的资源。 数据用途概述:...
    packageimg
  • 英法翻译数据集-英语至法语翻译项目-数据-通用

    2025年4月21日   

    英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-...
    packageimg
  • 电影字幕多语言平行数据集

    2025年4月20日   

    电影字幕多语言平行数据集 数据来源:互联网公开数据 标签:电影字幕,多语言平行数据,英语到阿拉伯语,英语到法语,英语到印度尼西亚语,英语到泰语,时间对齐,机器翻译,自然语言处理 数据概述:...
    packageimg
  • 英语-达里贾双语数据集

    2025年4月20日   

    英语-达里贾双语数据集 数据来源:互联网公开数据 标签:机器翻译,双语语料库,摩洛哥阿拉伯语,达里贾,自然语言处理,翻译模型,语言学习 数据概述: 本数据集是一个社区驱动的双语语料库,由MAD-...
    packageimg
  • 英语-泰语平行语料库

    2025年4月20日   

    英语-泰语平行语料库 数据来源:互联网公开数据 标签:平行语料库,机器翻译,自然语言处理,英语,泰语,跨语言分析,文本对齐,翻译模型训练 数据概述: 本数据集是一个大型的英语-...
    packageimg
  • 电影评论及其法语翻译数据集

    2025年4月20日   

    电影评论及其法语翻译数据集 数据来源:互联网公开数据 标签:电影评论,IMDb,法语翻译,文本处理,情感分析,机器翻译,跨语言分析 数据概述: 本数据集基于Aditya、P.等人的IMDb电影评论数据集构建,包含多部电影的评论数据,每条评论对应一部特定电影。数据集经过清洗和规则化处理,以确保数据质量,并使用Google Translate...
    packageimg
  • Flickr8k图像日语翻译数据集

    2025年4月19日   

    Flickr8k图像日语翻译数据集 数据来源:互联网公开数据 标签:图像标注,日语翻译,机器翻译,图像识别,自然语言处理,图像描述,Flickr8k,多模态,文本数据 数据概述:...
    packageimg
  • 印度语维基百科文章问答对数据集-问答生成-36-6k

    2025年4月19日   

    印度语维基百科文章问答对数据集-问答生成-36-6k 数据来源:互联网公开数据 标签:问答对,印度语,维基百科,自然语言处理,机器翻译,问答生成,文本数据,语言学习 数据概述:...
    packageimg
  • 多语言平行语料库数据集

    2025年4月19日   

    多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-...
    packageimg
  • 泰卢固语新闻文本数据集-语言模型训练-合并数据集

    2025年4月17日   

    泰卢固语新闻文本数据集-语言模型训练-合并数据集 数据来源:互联网公开数据 标签:泰卢固语,新闻,文本,语言模型,自然语言处理,NLP,机器学习,语料库,文本数据 数据概述: 本数据集由原始泰卢固语新闻数据合并的训练集和测试集构成,整合了来自不同来源的泰卢固语新闻文章。数据集包含丰富的新闻文本内容,涵盖了各种主题和风格。 数据用途概述:...
    packageimg
  • 英语-印地语句子翻译数据集

    2025年4月17日   

    英语-印地语句子翻译数据集 数据来源:互联网公开数据 标签:语言翻译,英语,印地语,机器翻译,自然语言处理,双语句对,文本对齐 数据概述: 本数据集来自Helsinki NLP Opus...
    packageimg
  • 大型语言模型训练合成数据-Synthia-v1-3数据集

    2025年4月17日   

    大型语言模型训练合成数据-Synthia-v1-3数据集 数据来源:互联网公开数据 标签:大型语言模型,合成数据,训练数据,自然语言处理,文本生成,机器翻译,问答系统,对话生成 数据概述: 本数据集是专为大型语言模型(LLM)开发和改进而设计的合成训练数据集,主要用于研究和优化migel...
    packageimg
  • 英语-伊博语圣经数据集

    2025年4月17日   

    英语-伊博语圣经数据集 数据来源:互联网公开数据 标签:机器翻译,伊博语,圣经文本,英语,语言数据,语料库,宗教文本 数据概述: 本数据集为英语和伊博语的圣经文本对齐数据,主要用于英语至伊博语的机器翻译研究。数据来源于Jehovah...
    packageimg
  • 古典藏文-英文翻译数据集

    2025年4月17日   

    古典藏文-英文翻译数据集 数据来源:互联网公开数据 标签:古典藏文,英文翻译,机器翻译,语料库,语言学研究,MT模型训练 数据概述: 本数据集包含古典藏文句子及其对应的英文翻译,每对数据由古典藏文句子和其英文翻译组成。数据集中的文本来源于Lotsawa...
    packageimg
  • IWSLT2017英语-中文翻译数据集

    2025年4月15日   

    IWSLT2017英语-中文翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,NLP,多语种,英中翻译,语言模型训练,语料库 数据概述 本数据集是IWSLT2017翻译任务的英语-中文平行语料数据集,主要用于机器翻译研究和多语言自然语言处理任务。数据集包含三个独立的CSV文件,分别存储训练集、验证集和测试集。数据来源于Hugging...
    packageimg
  • 韩国语翻译数据集

    2025年4月15日   

    韩国语翻译数据集 数据来源:互联网公开数据 标签:韩国语,翻译,NLP模型,机器翻译,自然语言处理,DeepL API,英译韩,语言学习 数据概述: 本数据集提供了一组从英语翻译成韩国语的文本数据,适用于GPT4ALL、Dolly、Vicuna等NLP模型的训练与研究。数据集由nlpai-lab团队整理,通过DeepL...
    packageimg