-
波斯语与英语翻译测试数据集-nouriehmadanian
波斯语与英语翻译测试数据集-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,语言模型,翻译质量评估,文本分析 数据概述: 该数据集包含波斯语到英语的翻译对,用于评估和训练机器翻译模型。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时间段的文本。... -
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn 数据来源:互联网公开数据 标签:字幕翻译,越南语,数据集,机器翻译,自然语言处理,文本分析,语言学,跨语言 数据概述:该数据集包含从英语到越南语的字幕翻译数据,用于字幕翻译任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源。... -
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:... -
歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa
歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa 数据来源:互联网公开数据 标签:歌词,翻译,数据集,音乐,自然语言处理,文本分析,多语言,机器翻译 数据概述: 该数据集包含了大量歌曲的歌词及其对应的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的歌曲。... -
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源:互联网公开数据 标签:自然语言处理,文本生成,文本校对,数据集,机器翻译,语言模型,文本纠错,人工智能 数据概述: 该数据集基于 Google 的大型语言模型 T5,记录了大规模文本生成和校对的数据。主要特征如下:... -
俄罗斯虚假信息翻译数据集RO-FACleanTranslateDataset-ilikehaskell
俄罗斯虚假信息翻译数据集RO-FACleanTranslateDataset-ilikehaskell 数据来源:互联网公开数据 标签:虚假信息,翻译,数据集,俄语,英语,文本分析,自然语言处理,机器翻译 数据概述: 该数据集包含了从俄罗斯来源获取的虚假信息文本,并提供了对应的英语翻译。主要特征如下:... -
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,问答系统,数据集,印地语,泰米尔语,深度学习,文本分析 数据概述: 该数据集包含从SQuAD... -
自然语言处理作业三测试数据集-hangman1998
自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。... -
英-马尔地语双语翻译数据集-mayakaripel
英-马尔地语双语翻译数据集-mayakaripel 数据来源:互联网公开数据 标签:英-马尔地语,双语翻译,机器翻译,NLP,语言学习,数据集,信息检索,情感分析,知识转移 数据概述: 本数据集包含成对的英-马尔地语翻译句子,为机器翻译和其他跨语言自然语言处理(NLP)任务提供了宝贵的资源。数据集中的每一对句子都是彼此的翻译,适用于开发和评估英-... -
英法翻译数据集English-FrenchTranslationDataset-endofnight17j03
英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:... -
双语文本对齐数据集BitextDataCollection-imaadhasan
双语文本对齐数据集BitextDataCollection-imaadhasan 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本对齐,双语数据,语言技术,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的双语文本对齐数据,记录了不同语言之间的文本对应关系。主要特征如下:... -
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器翻译,文本生成,深度学习,BERT模型 数据概述: 该数据集包含了用于训练和评估BERT模型的基础文本数据,用于构建BERT模型的基线实验。主要特征如下:... -
WebGPT与OpenAI模型性能对比数据集
WebGPT与OpenAI模型性能对比数据集 数据来源:互联网公开数据 标签:WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统 数据概述:... -
Mistral-8k困惑度评估数据集-hozaifazaki
Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。... -
英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro
英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,双语数据,英语,法语,文本分析,人工智能 数据概述: 该数据集包含来自公开来源的英语-... -
英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe
英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,语言学习,数据集,英语,尼泊尔语,文本翻译,语言技术... -
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch 数据来源:互联网公开数据 标签:德国联邦议院,演讲,文本分析,翻译,摘要,政治,NLP,自然语言处理,机器翻译,BART模型 数据概述: 本数据集包含1万篇德国联邦议院议员的演讲文本,这些演讲文本均来源于德国联邦议院官方网站。数据经过网络抓取,并使用OPUS-... -
波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian
波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,文本翻译,语言学,验证 数据概述: 该数据集包含来自Parsinlu项目,用于验证波斯语到英语翻译模型的性能。主要特征如下:... -
酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien
酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien 数据来源:互联网公开数据 标签:酒店评论,数据集,自然语言处理,机器翻译,文本分析,旅游行业,用户体验,情感分析 数据概述: 该数据集包含来自全球多家酒店的评论数据,记录了用户对酒店的评价和反馈,并提供了多语言翻译版本。主要特征如下:... -
伊朗阿尔帕卡数据集-英文到波斯文翻译-amirpourmand
伊朗阿尔帕卡数据集-英文到波斯文翻译-amirpourmand 数据来源:互联网公开数据 标签:阿尔帕卡数据集,翻译,英文,波斯文,Meta NLLB,机器翻译,NLP,数据集,翻译工具 数据概述: 本数据集由Meta...