-
美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah
美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah 数据来源:互联网公开数据 标签:专利数据,数据扩充,机器翻译,自然语言处理,数据集,文本分析,创新研究,知识产权... -
英印机器翻译练习数据集-arunmohan003
英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:... -
CommonLit英语文章摘要数据集-artisusxiren
CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:... -
阿拉伯语手语与阿拉伯英文句子对应数据集-mohamedlotfy50
阿拉伯语手语与阿拉伯英文句子对应数据集-mohamedlotfy50 数据来源:互联网公开数据 标签:阿拉伯语手语,机器翻译,自动翻译,教育,语言学,翻译,手语数据,阿拉伯语,英语 数据概述:... -
印度语电影字幕数据集HindiLanguageMovieSubtitlesDataset-mogazeyalmogazey
印度语电影字幕数据集HindiLanguageMovieSubtitlesDataset-mogazeyalmogazey 数据来源:互联网公开数据 标签:印度语,电影,字幕,自然语言处理,文本分析,语言学,机器翻译,数据集 数据概述: 该数据集包含了印度语电影的字幕数据,记录了大量印度语电影的字幕文本。主要特征如下:... -
孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath
孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本分析,机器学习,语言模型,数据集,文本分类,机器翻译 数据概述: 该数据集包含来自孟加拉语的段落文本数据,记录了孟加拉语的段落内容。主要特征如下: 时间跨度:数据记录的时间范围不明确。... -
尼日利亚多语言仇恨言论数据集2024-sharonibejih
尼日利亚多语言仇恨言论数据集2024-sharonibejih 数据来源:互联网公开数据 标签:仇恨言论,尼日利亚,多语言,机器翻译,社交媒体,数据分析 数据概述:... -
英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh
英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,语言学,深度学习,文本数据,英语西班牙语 数据概述: 该数据集包含英语到西班牙语的翻译对,记录了英语文本及其对应的西班牙语翻译。主要特征如下:... -
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,法语,数据挖掘,人工智能,多语言处理 数据概述: 该数据集来自WMT(Workshop on Machine... -
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:... -
土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15
土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15 数据来源:互联网公开数据 标签:情感分析,NLP,土耳其语,电影评论,用户反馈,数据集,交叉语言分析,机器翻译,数据科学 数据概述:... -
英语-孟加拉语多元化翻译数据集-2023年-golammostofas
英语-孟加拉语多元化翻译数据集-2023年-golammostofas 数据来源:互联网公开数据 标签:英语,孟加拉语,翻译,自然语言处理,NLP,对话生成,文化分析,机器翻译,多语言研究 数据概述:... -
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151 数据来源:互联网公开数据 标签:机器翻译,NLP,自然语言处理,翻译,英语,马拉地语,seq2seq,神经机器翻译,数据集 数据概述:... -
英语-马拉雅拉姆语言翻译数据集-nihalthomas15
英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:... -
跨语言问答数据集XQuAD印地语部分2019-nbroad
跨语言问答数据集XQuAD印地语部分2019-nbroad 数据来源:互联网公开数据 标签:跨语言问答,自然语言处理,机器翻译,多语言数据集,印地语,文本理解 数据概述: 本数据集是XQuAD(跨语言问答数据集)中的印地语部分,用于评估跨语言问答性能。数据集包含SQuAD v1.1开发集的子集,共有240段落和1190个问题-... -
跨语言问答数据集XQuAD多语言问答数据集-thedevastator
跨语言问答数据集XQuAD多语言问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答, 跨语言, 自然语言处理, 机器翻译, 文本理解, SQuAD, 语言模型, 英语, 西班牙语, 德语, 希腊语, 俄语, 土耳其语, 阿拉伯语, 越南语, 泰语, 汉语, 印地语 数据概述:... -
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:... -
英法翻译数据集-英语至法语翻译项目-数据-通用
英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-... -
电影字幕多语言平行数据集
电影字幕多语言平行数据集 数据来源:互联网公开数据 标签:电影字幕,多语言平行数据,英语到阿拉伯语,英语到法语,英语到印度尼西亚语,英语到泰语,时间对齐,机器翻译,自然语言处理 数据概述:... -
英语-达里贾双语数据集
英语-达里贾双语数据集 数据来源:互联网公开数据 标签:机器翻译,双语语料库,摩洛哥阿拉伯语,达里贾,自然语言处理,翻译模型,语言学习 数据概述: 本数据集是一个社区驱动的双语语料库,由MAD-...