找到628个数据集

标签: 机器翻译

过滤结果
  • 汉字华语处理句对数据集-yuweiiizz

    2025年4月23日   

    汉字华语处理句对数据集-yuweiiizz 数据来源:互联网公开数据 标签:汉字,华语,自然语言处理,机器翻译,语义分析,方言学,语料库,文本挖掘 数据概述: 本数据集包含传统中文与现代中文或台式中文之间的配对句子,旨在促进自然语言处理任务,特别是机器翻译和语义分析。每个数据对由一条传统中文句子及其等效的现代中文或台式中文句子组成。 数据用途概述:...
    packageimg
  • 科学论文摘要摘要数据集SciTLDR-A-adityawithdoublea

    2025年4月23日   

    科学论文摘要摘要数据集SciTLDR-A-adityawithdoublea 数据来源:互联网公开数据 标签:论文摘要, 文本摘要, 自然语言处理, 科学论文, 摘要生成, 机器翻译, 文本分析 数据概述: SciTLDR-...
    packageimg
  • Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版

    2025年4月23日   

    Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:...
    packageimg
  • 英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar

    2025年4月23日   

    英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,印地语,英语,自然语言处理,翻译研究,多语言 数据概述: 该数据集包含英语到印地语的翻译对,记录了4000个英语句子及其对应的印地语翻译。主要特征如下:...
    packageimg
  • 泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420

    2025年4月23日   

    泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:...
    packageimg
  • 多语言标记数据集MultilangTokensDataset-pranav51286

    2025年4月23日   

    多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:...
    packageimg
  • 沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy

    2025年4月23日   

    沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy 数据来源:互联网公开数据 标签:机器翻译,文本对比,数据集,自然语言处理,深度学习,文本分析,翻译质量,语言学 数据概述: 该数据集包含由IBM...
    packageimg
  • 阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache

    2025年4月23日   

    阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache 数据来源:互联网公开数据 标签:阿拉伯语,文本可读性,文本摘要,自然语言处理,语言学,数据集,机器翻译,深度学习 数据概述: 该数据集包含阿拉伯语文本,用于研究阿拉伯语文本的可读性和文本摘要。主要特征如下: 时间跨度: 数据记录的时间范围不明确,数据本身为静态文本集合。 地理范围:...
    packageimg
  • Evol-Codealpaca中英指令转换数据集

    2025年4月23日   

    Evol-Codealpaca中英指令转换数据集 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,中英翻译,指令转换,代码生成,语言模型,数据集,Hugging Face 数据概述: 本数据集由Evol-...
    packageimg
  • 汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29

    2025年4月23日   

    汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29 数据来源:互联网公开数据 标签:汉字转写,拉丁文翻译,数据集,自然语言处理,文本转换,机器翻译,语言学,字符编码 数据概述: 该数据集包含汉字与拉丁文之间的翻译数据,适用于研究汉字转写为拉丁文的技术。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 孟加拉数学问题文本数据集BanglaMathProblemCOTDataset-mushfiqurrahman6087

    2025年4月23日   

    孟加拉数学问题文本数据集BanglaMathProblemCOTDataset-mushfiqurrahman6087 数据来源:互联网公开数据 标签:数学问题,数据集,孟加拉语,COT,问题解答,自然语言处理,机器翻译,教育 数据概述: 该数据集包含孟加拉语数学问题的文本数据,旨在用于问题解答和自然语言处理任务。主要特征如下:...
    packageimg
  • 阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr

    2025年4月23日   

    阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,语言模型,机器翻译,阿拉伯语 数据概述: 该数据集包含阿拉伯语文本数据,记录了不同主题和类别的阿拉伯语文章,评论或文档。主要特征如下:...
    packageimg
  • Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui

    2025年4月23日   

    Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui 数据来源:互联网公开数据 标签:图像,斯瓦希里语,多模态,自然语言处理,图像描述,数据集,机器翻译,计算机视觉 数据概述:...
    packageimg
  • 英语和摩洛哥塔马兹格特与塔加拜勒特翻译数据集-thedevastator

    2025年4月23日   

    英语和摩洛哥塔马兹格特与塔加拜勒特翻译数据集-thedevastator 数据来源:互联网公开数据 标签:翻译,英语,摩洛哥塔马兹格特,塔加拜勒特,数据集,机器翻译,语言学,教育 数据概述: 本数据集来源于Mozilla的Pontoon本地化平台,名为imone/ARB指令-...
    packageimg
  • 英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar

    2025年4月23日   

    英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar 数据来源:互联网公开数据 标签:机器翻译,英语,西班牙语,数据集,自然语言处理,文本翻译,双语资源,语言技术 数据概述: 该数据集包含英语到西班牙语的平行文本数据,主要记录了双语句子对,适用于机器翻译和自然语言处理任务。主要特征如下:...
    packageimg
  • 英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69

    2025年4月23日   

    英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言数据,数据集,泰卢固语,英语,自然语言处理,翻译研究,多语言处理 数据概述: 该数据集包含英语到泰卢固语的句子翻译对,记录了大量的双语句子对照数据。主要特征如下:...
    packageimg
  • 印地文-英文双语数据集Hinglish-EnglishDataset-arpcode

    2025年4月23日   

    印地文-英文双语数据集Hinglish-EnglishDataset-arpcode 数据来源:互联网公开数据 标签:双语数据集,语言学,自然语言处理,机器翻译,文本分析,数据集,印度语言,国际交流 数据概述:该数据集包含来自多个来源的印地文-英文双语数据,主要用于研究和开发印地文与英文之间的翻译和文本分析。主要特征如下:...
    packageimg
  • 预训练RoBERTa-base模型预测结果数据集-mathislucka

    2025年4月22日   

    预训练RoBERTa-base模型预测结果数据集-mathislucka 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器翻译,文本分类,模型预测,RoBERTa,数据集 数据概述: 该数据集包含了基于预训练RoBERTa-base模型对文本数据的预测结果。主要特征如下:...
    packageimg
  • 自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb

    2025年4月22日   

    自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,深度学习,神经网络,文本处理,语言模型,翻译模型 数据概述:...
    packageimg
  • 阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889

    2025年4月22日   

    阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,数据集,文本分析,机器翻译,语言模型,文本语料库,语言学 数据概述: 该数据集包含超过70万条阿拉伯语句子,旨在为自然语言处理(NLP)任务提供丰富的文本语料库。主要特征如下:...
    packageimg