-
英语-孟加拉语多元化翻译数据集-2023年-golammostofas
英语-孟加拉语多元化翻译数据集-2023年-golammostofas 数据来源:互联网公开数据 标签:英语,孟加拉语,翻译,自然语言处理,NLP,对话生成,文化分析,机器翻译,多语言研究 数据概述:... -
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151 数据来源:互联网公开数据 标签:机器翻译,NLP,自然语言处理,翻译,英语,马拉地语,seq2seq,神经机器翻译,数据集 数据概述:... -
英语-马拉雅拉姆语言翻译数据集-nihalthomas15
英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:... -
格鲁吉亚汽车品牌与车型翻译数据集-alexey300479
格鲁吉亚汽车品牌与车型翻译数据集-alexey300479 数据来源:互联网公开数据 标签:汽车,品牌,车型,翻译,格鲁吉亚语,英语,数据预处理,机器学习 数据概述: 本数据集包含两个核心文件,用于汽车品牌和车型的翻译,主要服务于汽车价格预测等机器学习任务。 cars.csv:该文件包含了汽车制造商和车型的列表,其中车型信息以格鲁吉亚语呈现。... -
威尔士语词典语料库词汇及语境分析数据集-rtatman
威尔士语词典语料库词汇及语境分析数据集-rtatman 数据来源:互联网公开数据 标签:威尔士语,词典,语言学,语料库,词汇,语言分析,凯尔特语,翻译,双语,单语 数据概述:... -
达里贾-英-阿拉伯语语言学数据集1963-2021-aminemontasir
达里贾-英-阿拉伯语语言学数据集1963-2021-aminemontasir 数据来源:互联网公开数据 标签:达里贾,阿拉伯语,英语,翻译,语言学,语法,动词变位,冠词确定,复数形式 数据概述:... -
英博平行语料库数据集-jigarpanjiyar
英博平行语料库数据集-jigarpanjiyar 数据来源:互联网公开数据 标签:英博语料库,语言学习,翻译,平行语料库,多语言数据集,教育 数据概述:... -
数学科目推理题库-孟加拉语翻译数据集-202X-mahfuzulkabirsourav
数学科目推理题库-孟加拉语翻译数据集-202X-mahfuzulkabirsourav 数据来源:互联网公开数据 标签:数学科目,推理题,孟加拉语,翻译,高质量,教育,学术 数据概述: 本数据集是NuminaMath-COT数据集的孟加拉语翻译子集,涵盖了数学推理题目及其答案解析。数据集中的题目和解答均通过使用LLMs-in-... -
吠陀文献梵文与纳格里文字对照及其英译数据集-anshulmehtakaggl
吠陀文献梵文与纳格里文字对照及其英译数据集-anshulmehtakaggl 数据来源:互联网公开数据 标签:梵文,吠陀文献,纳格里文,英译,翻译,NLP,语言学 数据概述: 本数据集收录了吠陀文献中的梵文字词及其对应的纳格里文字母写法和英文翻译。数据集旨在为语言学研究、翻译工作、自然语言处理(NLP)等领域提供基础数据支持。数据集字段包括:... -
英法翻译数据集-英语至法语翻译项目-数据-通用
英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-... -
阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用
阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用 数据来源:互联网公开数据 标签:阿拉伯语,作文评分,自然语言处理,机器学习,数据集,文本分类,多语言,Open Orca, GPT-3.5, GPT-4, RAG, 翻译 数据概述:... -
多语言平行语料库数据集
多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-... -
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语
Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述:... -
韩国语翻译数据集
韩国语翻译数据集 数据来源:互联网公开数据 标签:韩国语,翻译,NLP模型,机器翻译,自然语言处理,DeepL API,英译韩,语言学习 数据概述: 本数据集提供了一组从英语翻译成韩国语的文本数据,适用于GPT4ALL、Dolly、Vicuna等NLP模型的训练与研究。数据集由nlpai-lab团队整理,通过DeepL... -
多语言软件缺陷报告及其翻译数据集1963-2025
多语言软件缺陷报告及其翻译数据集1963-2025 数据来源:互联网公开数据 标签:多语言,软件缺陷报告,翻译,自然语言处理,机器翻译,跨语言分析 数据概述:... -
荷马伊利亚特文本数据集
荷马伊利亚特文本数据集 数据来源:互联网公开数据 标签:荷马,伊利亚特,双语文本,希腊语,英语,翻译,文学分析,语言学,比较文学 数据概述: 本数据集包含荷马史诗《伊利亚特》的双语文本,分别为希腊语原文和英文翻译。数据集由三个表格组成,每个表格包含分析《伊利亚特》所需的必要信息。 希腊文本表:... -
土耳其与英语对照词典数据集
土耳其与英语对照词典数据集 数据来源:互联网公开数据 标签:土耳其语,英语,词汇,翻译,语言学习,词典,跨语言研究 数据概述: 本数据集收录了土耳其语与英语之间的对照词汇,包含土耳其语词汇、对应的英语翻译以及使用场景的分类信息。数据集涵盖多个使用场景,为跨语言研究、翻译工具开发和语言学习提供了可靠的语言对照资源。 数据用途概述:... -
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集
梵语史诗摩诃婆罗多和罗摩衍那诗句英译数据集 数据来源:互联网公开数据 标签:梵语, 史诗, 翻译, 语言学, 文本, 诗歌, 语料库, 机器学习, 文本生成 数据概述: 本数据集是一个梵语-英语翻译语料库,包含了从M. N.... -
莎士比亚十四行诗菲律宾语翻译数据集
莎士比亚十四行诗菲律宾语翻译数据集 数据来源:互联网公开数据 标签:莎士比亚,十四行诗,翻译,菲律宾语,Tagalog,文本数据,文学,语言学 数据概述: 本数据集包含威廉·莎士比亚十四行诗的ASCII文本,总共有超过2,450行。原文本从Andrej Karpathy的GitHub仓库minGPT复制而来。随后,我们使用ChatGPT... -
印度尼西亚至马来语桑巴斯翻译数据集
印度尼西亚至马来语桑巴斯翻译数据集 数据来源:互联网公开数据 标签:翻译,印度尼西亚语,马来语,桑巴斯语,语言学,自然语言处理,多语言数据集 数据概述: 本数据集包含印度尼西亚语句子及其在马来语(桑巴斯方言)中的翻译。数据集来源于公开的GitHub资源,涵盖了广泛的主题和内容,为语言学研究提供了丰富的语料库。 数据用途概述:...