-
-
基于GPT-3的改写文章数据集
基于GPT-3的改写文章数据集 数据来源:互联网公开数据 标签:GPT-3,文本改写,自然语言处理,摘要,引言,数据增强,机器翻译 数据概述: 本数据集包含由GPT-3语言模型改写的文章标题、摘要和引言部分。原始文章选自Assoc. Prof. Mehmet Erkut Erdem的Google Scholar页面,并通过GPT-3... -
-
斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-
斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -... -
印地语-英语音译数据集
印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-... -
摩洛哥阿拉伯语Darija语言任务与平行翻译数据集
摩洛哥阿拉伯语Darija语言任务与平行翻译数据集 数据来源:互联网公开数据 标签:摩洛哥阿拉伯语, Darija, 机器翻译, 语言模型, 平行语料库, 自然语言处理, 多语言学习 数据概述:... -
PHINC-平行印地英混合语社交媒体语料库用于机器翻译
PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:... -
僧伽罗语-英语-新加坡英语翻译数据集
僧伽罗语-英语-新加坡英语翻译数据集 数据来源:互联网公开数据 标签:僧伽罗语,英语,新加坡英语,翻译数据,语言学习,机器翻译,语言学研究 数据概述: 本数据集包含僧伽罗语、英语和新加坡英语之间的翻译文本,每行记录包括一段僧伽罗语原文及其对应的英语和新加坡英语翻译。数据集结构清晰,便于进行文本分析和处理,为语言研究和翻译技术开发提供了可靠的数据支持。... -
印度次大陆嘻哈歌曲创作与语言应用数据集
印度次大陆嘻哈歌曲创作与语言应用数据集 数据来源:互联网公开数据 标签:嘻哈,歌词,创意写作,自然语言处理,机器翻译,情感分析,转录,印度,DHH,Desi Hip Hop 数据概述:... -
Hinglish印地语-英语混合语机器翻译数据集
Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish... -
-
神经机器翻译-玉刚数据集
神经机器翻译-玉刚数据集 数据来源:互联网公开数据 标签:神经机器翻译,玉刚,语言模型,数据集,机器翻译,自然语言处理,翻译质量评估 数据概述: 本数据集包含约12,000个玉刚语言的 instructional... -
沃森翻译增强训练测试数据集
沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:... -
翻译数学问题数据集
翻译数学问题数据集 数据来源:互联网公开数据 标签:数学问题,翻译, Bengali, English, 语言模型, 机器翻译, 取回增强生成, 少样本学习 数据概述:... -
欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语
欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据 数据概述: ELRC-... -
英伊博对照词典数据集
英伊博对照词典数据集 数据来源:互联网公开数据 标签:英伊博翻译,词典,机器翻译,语言学,文本翻译 数据概述: 本数据集用于英伊博机器翻译,包含从英伊博翻译词典网站抓取的文本文件。数据集包括英文单词和对应的伊博文单词,并以CSV文件的形式提供了双语对照表,为英伊博翻译任务提供了基础数据支持。 数据用途概述:... -
孟加拉语对话摘要数据集英文翻译
孟加拉语对话摘要数据集英文翻译 数据来源:互联网公开数据 标签:对话摘要, 孟加拉语, 自然语言处理, 机器翻译, 文本摘要, 语言数据, 翻译数据集 数据概述:... -
斯里兰卡Singlish与僧伽罗语对话数据集
斯里兰卡Singlish与僧伽罗语对话数据集 数据来源:互联网公开数据 标签:Singlish,僧伽罗语,对话数据集,NLP,聊天机器人,机器翻译,语言学习,社会媒体分析,语言研究 数据概述:... -
数据1000对孟加拉语到俄语翻译数据集
数据1000对孟加拉语到俄语翻译数据集 数据来源:互联网公开数据 标签:孟加拉语,俄语,翻译,语言学研究,机器翻译,语料库,双语系统,自然语言处理 数据概述:... -
多语言复杂问答数据集-涵盖8种语言
多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...