找到984个数据集

标签: 机器翻译

过滤结果
  • 多语言翻译标签数据集TagsandTranslationDataset-outlook0

    2025年4月24日   

    多语言翻译标签数据集TagsandTranslationDataset-outlook0 数据来源:互联网公开数据 标签:多语言翻译,数据集,标签管理,自然语言处理,机器翻译,文本分析,数据科学,信息处理 数据概述: 该数据集包含了来自多个来源的标签及其多语言翻译,适用于标签管理和多语言系统的构建。主要特征如下:...
    packageimg
  • 英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir

    2025年4月24日   

    英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,乌尔都语,英语,文本翻译,多语言 数据概述: 该数据集包含来自多个公开来源的英语到乌尔都语的平行语料,记录了双语句子对。主要特征如下:...
    packageimg
  • 圣经多语言阿拉伯语-法语数据集-oumarbenlol

    2025年4月24日   

    圣经多语言阿拉伯语-法语数据集-oumarbenlol 数据来源:互联网公开数据 标签:圣经,多语言,阿拉伯语,法语,文本数据,自然语言处理,语言学,翻译 数据概述: 该数据集包含圣经的阿拉伯语和法语翻译版本,旨在支持跨语言研究和文本分析。主要特征如下: 时间跨度:数据涵盖了圣经的完整文本,版本内容依据发布时间而定。...
    packageimg
  • 多语言定制数据集MultilingualCustomDataset-amarendradeo

    2025年4月24日   

    多语言定制数据集MultilingualCustomDataset-amarendradeo 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分析,语言模型,文本语料库,跨语言 数据概述: 该数据集包含多种语言的文本数据,旨在支持多语言处理任务,特别是机器翻译和语言模型训练。主要特征如下:...
    packageimg
  • 土耳其语翻译版H4NO机器人数据集TurkishTranslationofH4NORobotsDataset-unofficialmerve

    2025年4月24日   

    土耳其语翻译版H4NO机器人数据集TurkishTranslationofH4NORobotsDataset-unofficialmerve 数据来源:互联网公开数据 标签:机器人数据,土耳其语,翻译数据,数据集,自然语言处理,机器翻译,人工智能,多语言研究 数据概述:...
    packageimg
  • 豪萨语语料库数据集HausaCorporaDataset-isadutse

    2025年4月24日   

    豪萨语语料库数据集HausaCorporaDataset-isadutse 数据来源:互联网公开数据 标签:豪萨语,语料库,语言学,自然语言处理,机器翻译,数据集,学术研究,文化研究 数据概述:该数据集包含来自多种来源的豪萨语语料,记录了豪萨语的文本数据,适用于语言学研究,自然语言处理和机器翻译等任务。主要特征如下:...
    packageimg
  • 波斯语与英语翻译测试数据集-nouriehmadanian

    2025年4月24日   

    波斯语与英语翻译测试数据集-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,语言模型,翻译质量评估,文本分析 数据概述: 该数据集包含波斯语到英语的翻译对,用于评估和训练机器翻译模型。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时间段的文本。...
    packageimg
  • 越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn

    2025年4月24日   

    越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn 数据来源:互联网公开数据 标签:字幕翻译,越南语,数据集,机器翻译,自然语言处理,文本分析,语言学,跨语言 数据概述:该数据集包含从英语到越南语的字幕翻译数据,用于字幕翻译任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源。...
    packageimg
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa

    2025年4月24日   

    歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa 数据来源:互联网公开数据 标签:歌词,翻译,数据集,音乐,自然语言处理,文本分析,多语言,机器翻译 数据概述: 该数据集包含了大量歌曲的歌词及其对应的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的歌曲。...
    packageimg
  • 大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57

    2025年4月24日   

    大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源:互联网公开数据 标签:自然语言处理,文本生成,文本校对,数据集,机器翻译,语言模型,文本纠错,人工智能 数据概述: 该数据集基于 Google 的大型语言模型 T5,记录了大规模文本生成和校对的数据。主要特征如下:...
    packageimg
  • 俄罗斯虚假信息翻译数据集RO-FACleanTranslateDataset-ilikehaskell

    2025年4月24日   

    俄罗斯虚假信息翻译数据集RO-FACleanTranslateDataset-ilikehaskell 数据来源:互联网公开数据 标签:虚假信息,翻译,数据集,俄语,英语,文本分析,自然语言处理,机器翻译 数据概述: 该数据集包含了从俄罗斯来源获取的虚假信息文本,并提供了对应的英语翻译。主要特征如下:...
    packageimg
  • 谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261

    2025年4月24日   

    谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,问答系统,数据集,印地语,泰米尔语,深度学习,文本分析 数据概述: 该数据集包含从SQuAD...
    packageimg
  • 自然语言处理作业三测试数据集-hangman1998

    2025年4月24日   

    自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。...
    packageimg
  • 英-马尔地语双语翻译数据集-mayakaripel

    2025年4月24日   

    英-马尔地语双语翻译数据集-mayakaripel 数据来源:互联网公开数据 标签:英-马尔地语,双语翻译,机器翻译,NLP,语言学习,数据集,信息检索,情感分析,知识转移 数据概述: 本数据集包含成对的英-马尔地语翻译句子,为机器翻译和其他跨语言自然语言处理(NLP)任务提供了宝贵的资源。数据集中的每一对句子都是彼此的翻译,适用于开发和评估英-...
    packageimg
  • 英法翻译数据集English-FrenchTranslationDataset-endofnight17j03

    2025年4月24日   

    英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:...
    packageimg
  • 双语文本对齐数据集BitextDataCollection-imaadhasan

    2025年4月24日   

    双语文本对齐数据集BitextDataCollection-imaadhasan 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本对齐,双语数据,语言技术,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的双语文本对齐数据,记录了不同语言之间的文本对应关系。主要特征如下:...
    packageimg
  • BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige

    2025年4月24日   

    BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器翻译,文本生成,深度学习,BERT模型 数据概述: 该数据集包含了用于训练和评估BERT模型的基础文本数据,用于构建BERT模型的基线实验。主要特征如下:...
    packageimg
  • WebGPT与OpenAI模型性能对比数据集

    2025年4月24日   

    WebGPT与OpenAI模型性能对比数据集 数据来源:互联网公开数据 标签:WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统 数据概述:...
    packageimg
  • Mistral-8k困惑度评估数据集-hozaifazaki

    2025年4月24日   

    Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。...
    packageimg