-
Jigsaw竞赛英语翻译文本数据集
2025年6月1日 30 59 35
Jigsaw竞赛英语翻译文本数据集 数据来源:互联网公开数据 标签:Jigsaw, 翻译, 文本, 英语, 自然语言处理, 文本分析, 机器学习, 竞赛, 负面评论, 错误标识 数据概述:... -
Jigsaw多语言评论训练数据集-2021-miklgr500
2025年5月31日 30 73 12
Jigsaw多语言评论训练数据集-2021-miklgr500 数据来源:互联网公开数据 标签:Jigsaw,多语言,评论,分类,机器学习,Google API,翻译,训练数据 数据概述: 本数据集是“Jigsaw多语言毒评论分类”竞赛的翻译训练数据集,使用了Google... -
Numina数学问题及解题思路双语数据集-2023
2025年5月31日 30 201 92
Numina数学问题及解题思路双语数据集-2023 数据来源:互联网公开数据 标签:数学问题,解题思路,双语数据,LaTeX格式,Numina,CoT,翻译,教育 数据概述: 本数据集包含约86万个数学问题,源自Numina-CoT数据集,并将其翻译成孟加拉语。每个问题的解答均采用链式思维(Chain of Thought,... -
印度最高法院判决书英汉平行语料库数据集-varuthakari
2025年5月31日 30 39 21
印度最高法院判决书英汉平行语料库数据集-varuthakari 数据来源:互联网公开数据 标签:最高法院,判决书,印度,法律,语料库,翻译,英汉,司法,印度Kanoon, IndicTrans2 数据概述: 本数据集是一个英汉平行语料库,内容源自印度最高法院的判决书。原始判决书从Indian... -
日语词典数据集JPNDictDataset-abhi5ingh
2025年5月30日 30 165 42
日语词典数据集JPNDictDataset-abhi5ingh 数据来源:互联网公开数据 标签:语言学,词典,数据集,日语学习,自然语言处理,教育,翻译,语言研究 数据概述: 该数据集包含来自日语词典的数据,记录了日语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,但内容涵盖现代日语常用词汇。... -
训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa
2025年5月29日 30 175 134
训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa 数据来源:互联网公开数据 标签:翻译,数据集,自然语言处理,机器学习,多语言,文本处理,语言模型,人工智能 数据概述: 该数据集包含来自多个公开来源的翻译训练数据,记录了多种语言之间的翻译对。主要特征如下:... -
数据3000本翻译成俄语的书籍数据集-dmitrybarsu
2025年5月29日 30 93 15
3000本翻译成俄语的书籍数据集-dmitrybarsu 数据来源:互联网公开数据 标签:书籍,翻译,俄语,数据集,自然语言处理,文本分析,语言学,机器翻译 数据概述: 该数据集包含3000本已翻译成俄语的书籍文本,涵盖了多种主题和文学体裁。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同年代的翻译作品。... -
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan
2025年5月29日 30 203 112
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:... -
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555
2025年5月29日 30 140 115
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:文本数据,翻译,评论,自然语言处理,机器学习,多语言,文本分析,情感分析 数据概述: 该数据集来自 Jigsaw 竞赛,主要包含了经过翻译的评论文本,旨在用于多语言环境下的有害评论检测任务。主要特征如下:... -
手语翻译数据集GLOFE-How2Sign-lmnggia
2025年5月28日 30 66 34
手语翻译数据集GLOFE-How2Sign-lmnggia 数据来源:互联网公开数据 标签:手语,翻译,数据集,计算机视觉,自然语言处理,多模态,机器学习,人工智能 数据概述: 该数据集包含来自GLOFE-How2Sign项目的手语视频和对应的文本翻译数据,用于手语翻译和相关研究。主要特征如下:... -
英汉阿拉伯语翻译数据集450-510句对-emam2002
2025年5月16日 30 143 56
英汉阿拉伯语翻译数据集450-510句对-emam2002 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,阿拉伯语,英语,翻译,自然语言处理,文本数据 数据概述: 该数据集包含450到510个英汉-阿拉伯语翻译对,旨在促进英汉和阿拉伯语之间的机器翻译研究和开发。主要特征如下: 时间跨度:数据主要集中在当前语言使用情境。... -
文本生成与翻译数据集En-T5ParaphraseDataset-terrychanorg
2025年5月14日 30 72 61
文本生成与翻译数据集En-T5ParaphraseDataset-terrychanorg 数据来源:互联网公开数据 标签:文本生成,翻译,数据集,自然语言处理,机器学习,深度学习,语言模型,文本分析 数据概述: 该数据集包含来自En-T5模型的文本生成与翻译数据,主要记录了英语文本的同义句生成和翻译任务的数据。主要特征如下:... -
医学知识问答多语言翻译数据集MedicalKnowledgeQuestionAnsweringMultilingualTranslationDataset...
2025年5月13日 30 146 4
医学知识问答多语言翻译数据集MedicalKnowledgeQuestionAnsweringMultilingualTranslationDataset-kienngodoan 数据来源:互联网公开数据 标签:医学, 问答, 翻译, 自然语言处理, 机器翻译, 多语言, 文本数据, 知识图谱 数据概述:... -
交通法规翻译对照数据集TrafficLawTranslationDataset-amejamie
2025年5月13日 30 181 112
交通法规翻译对照数据集TrafficLawTranslationDataset-amejamie 数据来源:互联网公开数据 标签:交通法规, 翻译, 文本翻译, 机器翻译, 法律文本, 对照分析, 多语言, 数据挖掘 数据概述: 该数据集包含来自多个国家或地区的交通法规文本及其对应的翻译版本,旨在提供交通法规的原文与翻译对照。主要特征如下:... -
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91
2025年5月1日 30 193 21
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91 数据来源:互联网公开数据 标签:印尼语, 宗教文本, 翻译, 文本对齐, 自然语言处理, 机器翻译, 语料库, 文本分析 数据概述: 该数据集包含来自印度尼西亚语的宗教文本,记录了原始文本及其对应的翻译。主要特征如下:... -
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297
2025年5月1日 30 139 57
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297 数据来源:互联网公开数据 标签:努佩语, 古兰经, 翻译, 语言学, 文本分析, 跨语言, 宗教, 语义分析 数据概述: 该数据集包含古兰经的英文和努佩语(Nupe)翻译,记录了古兰经经文的跨语言对照。主要特征如下:... -
墨西哥亡灵节祭文相似度分析数据集MexicoDayoftheDeadOfferingTextSimilarityAnalysis-agmeque
2025年5月1日 30 32 15
墨西哥亡灵节祭文相似度分析数据集MexicoDayoftheDeadOfferingTextSimilarityAnalysis-agmeque 数据来源:互联网公开数据 标签:文本相似度, 亡灵节, 祭文, 语义分析, 西班牙语, 翻译, 自然语言处理, 文本挖掘 数据概述:... -
阿姆哈拉语及英语词典与翻译数据集AmharicandEnglishDictionaryandTranslationDataset-ferox98
2025年5月1日 30 24 21
阿姆哈拉语及英语词典与翻译数据集AmharicandEnglishDictionaryandTranslationDataset-ferox98 数据来源:互联网公开数据 标签:阿姆哈拉语, 英语, 词典, 翻译, 语言学, 词汇, 语言学习, 多语言 数据概述:... -
孟加拉语翻译数据集BanglaTranslationDataset-emammame
2025年4月29日 30 48 18
孟加拉语翻译数据集BanglaTranslationDataset-emammame 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 文本翻译, 自然语言处理, 语言模型, 文本数据, 语料库, 翻译 数据概述: 该数据集包含英语到孟加拉语的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下:... -
英语西班牙语翻译对照数据集English-SpanishTranslationPairs-nouranader
2025年4月29日 30 206 86
英语西班牙语翻译对照数据集English-SpanishTranslationPairs-nouranader 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 词汇对照, 文本数据, 西班牙语, 英语, 数据集, 翻译 数据概述:...