找到240个数据集

标签: 英语

过滤结果
  • 古吉拉特语与英语新闻标题分类数据集

    2025年10月30日 30 151 69

    古吉拉特语与英语新闻标题分类数据集_Gujarati_and_English_News_Headline_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类,新闻标题,多语言,古吉拉特语,英语,情感分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 英语写作质量多维度评估数据集

    2025年10月19日 30 161 136

    英语写作质量多维度评估数据集_English_Writing_Quality_Multi_dimensional_Evaluation_Dataset 数据来源:互联网公开数据 标签:写作质量评估, 文本分析, 英语, 语法, 连贯性, 词汇, 机器学习, 自然语言处理 数据概述:...
    packageimg
  • 多语言文本嵌入与翻译数据集

    2025年10月3日 30 186 99

    多语言文本嵌入与翻译数据集_Multilingual_Text_Embedding_and_Translation_Dataset 数据来源:互联网公开数据 标签:文本嵌入, 词向量, 机器翻译, 英语, 西班牙语, 语料库, 自然语言处理, 数据集 数据概述:...
    packageimg
  • 印度泰米尔-英语文本情感分析数据集2021

    2025年4月15日 60 127 39

    印度泰米尔-英语文本情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,泰米尔语,英语,多语言处理,社交媒体评论,文本分类,自然语言处理 数据概述: 本数据集包含从YouTube视频评论中收集的15,744条泰米尔-...
    packageimg
  • 欧盟多语言翻译文本数据集

    2025年10月1日 30 183 72

    欧盟多语言翻译文本数据集_Multilingual_Translation_Text_Dataset 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学, 文本数据, 英语, 西班牙语, 意大利语, 文本对齐 数据概述: 该数据集包含来自欧盟官方文档的翻译文本,记录了英语与西班牙语、英语与意大利语之间的对应翻译。主要特征如下:...
    packageimg
  • 泰米尔语_英语语音翻译数据集

    2025年9月26日 30 62 30

    泰米尔语_英语语音翻译数据集_Tamil_English_Speech_Translation_Dataset 数据来源:互联网公开数据 标签:语音识别, 语音翻译, 泰米尔语, 英语, 多语言, 语音, 文本, 机器学习 数据概述: 该数据集包含泰米尔语和英语的语音数据及对应的文本转录和翻译,旨在促进泰米尔语与英语之间的语音翻译研究。主要特征如下:...
    packageimg
  • 机器翻译文本对数据集

    2025年7月21日 30 160 132

    机器翻译文本对数据集_Machine_Translation_Text_Pairs 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言学, 文本翻译, 英语, 葡萄牙语, 自然语言处理, 双语语料库 数据概述: 该数据集包含来自互联网的翻译文本对,记录了英语与葡萄牙语之间的句子翻译实例,适用于机器翻译模型的训练与评估。主要特征如下:...
    packageimg
  • 英语写作质量评估预测数据集

    2025年7月11日 30 14 8

    英语写作质量评估预测数据集_English_Writing_Quality_Assessment_and_Prediction 数据来源:互联网公开数据 标签:写作质量, 文本评估, 自然语言处理, 机器学习, 深度学习, 语言模型, 文本分析, 英语 数据概述:...
    packageimg
  • 爱尔兰语_英语平行语料库数据集

    2025年7月10日 30 68 13

    爱尔兰语_英语平行语料库数据集_Irish_English_Parallel_Corpus 数据来源:互联网公开数据 标签:机器翻译, 语言学, 平行语料库, 爱尔兰语, 英语, 自然语言处理, 文本翻译, 数据集构建 数据概述: 该数据集包含来自多个来源的爱尔兰语-英语平行语料,旨在促进爱尔兰语和英语之间的机器翻译研究与应用。主要特征如下:...
    packageimg
  • 多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset

    2025年6月25日 30 57 23

    多语言手写体图像数据集_Multilingual_Handwritten_Image_Dataset 数据来源:互联网公开数据 标签:手写体识别, 图像识别, 多语言, 卡纳达语, 英语, 文本检测, OCR, 数据集 数据概述: 该数据集包含多语言手写体图像数据,记录了卡纳达语和英语的手写字符、单词和句子图像。主要特征如下:...
    packageimg
  • Jigsaw竞赛英语翻译文本数据集

    2025年6月1日 30 20 13

    Jigsaw竞赛英语翻译文本数据集 数据来源:互联网公开数据 标签:Jigsaw, 翻译, 文本, 英语, 自然语言处理, 文本分析, 机器学习, 竞赛, 负面评论, 错误标识 数据概述:...
    packageimg
  • Coursera数据科学专项课程数据集-文本内容分析-英语语料库

    2025年6月1日 30 64 25

    Coursera数据科学专项课程数据集-文本内容分析-英语语料库 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,语料库,Coursera,博客,新闻,推特,英语,数据科学 数据概述: 本数据集是Coursera数据科学专项课程的Capstone项目所使用的数据集,其语料库来源于HC...
    packageimg
  • 多语言视觉问答数据集

    2025年5月31日 30 190 187

    多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-...
    packageimg
  • 推特-趣味事实-推文内容分析数据集英文

    2025年5月31日 30 170 65

    推特-趣味事实-推文内容分析数据集英文 数据来源:互联网公开数据 标签:推特,社交媒体,趣味事实,推文,内容分析,语言学,信息传播,英语 数据概述: 本数据集收录了推特(Twitter)上所有包含短语“Fun...
    packageimg
  • 柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato

    2025年5月30日 30 133 51

    柬埔寨新闻双语翻译数据集CambodiaNewsBilingualTranslationDataset-newmashedpotato 数据来源:互联网公开数据 标签:机器翻译, 柬埔寨语, 英语, 双语语料, 新闻, 文本分析, 自然语言处理, 语言学 数据概述:...
    packageimg
  • 维基百科文章数据集

    2025年5月30日 30 24 23

    维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,文本分析,数据挖掘,NLP,英语,开源数据 数据概述:...
    packageimg
  • 大语言模型对话比较数据集LargeLanguageModelDialogueComparisonDataset-sparsh35

    2025年5月30日 30 202 163

    大语言模型对话比较数据集LargeLanguageModelDialogueComparisonDataset-sparsh35 数据来源:互联网公开数据 标签:大语言模型, 对话分析, 模型评估, 自然语言处理, 文本生成, 对比分析, 机器学习, 英语 数据概述:...
    packageimg
  • 商品订单越南语-英语翻译数据集ProductOrderVietnamese-EnglishTranslation-vhonghoavin

    2025年5月30日 30 34 24

    商品订单越南语-英语翻译数据集ProductOrderVietnamese-EnglishTranslation-vhonghoavin 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 越南语, 英语, 商品描述, 电商, 自然语言处理, 数据集 数据概述:...
    packageimg
  • 英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar

    2025年5月30日 30 26 8

    英语到德语机器翻译数据集WMTEng-DeSubsetDataset-parvakumar 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,德语,文本翻译,深度学习,语言技术 数据概述: 该数据集来源于WMT(Workshop on Machine...
    packageimg
  • 多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules

    2025年5月30日 30 30 8

    多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 文本分析, 语言学, 文本比对, 英语, 西班牙语 数据概述:...
    packageimg