找到388个数据集

标签: 多语言

过滤结果
  • 孟加拉语新闻文章数据集BanglaNewsArticleDataset-asifahmedshodip

    2025年4月24日   

    孟加拉语新闻文章数据集BanglaNewsArticleDataset-asifahmedshodip 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,新闻分类,多语言,孟加拉语 数据概述: 该数据集包含来自孟加拉语新闻网站和媒体平台的新闻文章数据,记录了各类新闻事件和话题的报道内容。主要特征如下:...
    packageimg
  • 英语到法语翻译数据集EnglishtoFrenchTranslationDataset-karanmakwana001

    2025年4月24日   

    英语到法语翻译数据集EnglishtoFrenchTranslationDataset-karanmakwana001 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,文本分析,多语言,人工智能,教育技术 数据概述: 该数据集包含来自公开翻译资源的英语到法语的平行文本数据,记录了大量的双语句子对。主要特征如下:...
    packageimg
  • 泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss

    2025年4月24日   

    泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss 数据来源:互联网公开数据 标签:新闻分类,文本处理,数据集,机器学习,自然语言处理,多语言,信息检索,数据挖掘 数据概述: 该数据集包含来自泰国新闻网站的新闻文章数据,记录了不同类别新闻的分类信息。主要特征如下:...
    packageimg
  • 语言识别数据集LanguageDetectorDataset-meet07824

    2025年4月24日   

    语言识别数据集LanguageDetectorDataset-meet07824 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,人工智能,数据分析 数据概述: 该数据集包含来自公开来源的语言识别数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:...
    packageimg
  • 英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir

    2025年4月24日   

    英语到乌尔都语翻译数据集EnglishtoUrduTranslationDataset-younismir 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,乌尔都语,英语,文本翻译,多语言 数据概述: 该数据集包含来自多个公开来源的英语到乌尔都语的平行语料,记录了双语句子对。主要特征如下:...
    packageimg
  • 圣经多语言阿拉伯语-法语数据集-oumarbenlol

    2025年4月24日   

    圣经多语言阿拉伯语-法语数据集-oumarbenlol 数据来源:互联网公开数据 标签:圣经,多语言,阿拉伯语,法语,文本数据,自然语言处理,语言学,翻译 数据概述: 该数据集包含圣经的阿拉伯语和法语翻译版本,旨在支持跨语言研究和文本分析。主要特征如下: 时间跨度:数据涵盖了圣经的完整文本,版本内容依据发布时间而定。...
    packageimg
  • 多语言定制数据集MultilingualCustomDataset-amarendradeo

    2025年4月24日   

    多语言定制数据集MultilingualCustomDataset-amarendradeo 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分析,语言模型,文本语料库,跨语言 数据概述: 该数据集包含多种语言的文本数据,旨在支持多语言处理任务,特别是机器翻译和语言模型训练。主要特征如下:...
    packageimg
  • 歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa

    2025年4月24日   

    歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa 数据来源:互联网公开数据 标签:歌词,翻译,数据集,音乐,自然语言处理,文本分析,多语言,机器翻译 数据概述: 该数据集包含了大量歌曲的歌词及其对应的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的歌曲。...
    packageimg
  • 翻译数据数据集TranslatedDataDataset-krsna540

    2025年4月24日   

    翻译数据数据集TranslatedDataDataset-krsna540 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,机器学习,自然语言处理,多语言,文本分析,数据转换 数据概述: 该数据集包含来自互联网的翻译数据,记录了不同语言之间的文本翻译结果。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 中文文本翻译数据集TranslatedTextDataset-amithsurasani

    2025年4月24日   

    中文文本翻译数据集TranslatedTextDataset-amithsurasani 数据来源:互联网公开数据 标签:文本翻译,数据集,自然语言处理,机器学习,语言学,人工智能,多语言,文本分析 数据概述: 该数据集包含来自互联网公开来源的中文文本翻译数据,记录了多种语言与中文之间的翻译对。主要特征如下:...
    packageimg
  • 多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike

    2025年4月24日   

    多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,情感分析,机器学习,文本分类,情感识别,语言处理 数据概述:...
    packageimg
  • 西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd

    2025年4月24日   

    西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd 数据来源:互联网公开数据 标签:音乐,歌词,数据集,语言分析,自然语言处理,文化研究,机器学习,多语言 数据概述: 该数据集包含来自互联网公开渠道的西班牙语歌曲歌词数据,记录了多种西班牙语歌曲的歌词文本。主要特征如下:...
    packageimg
  • 欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar

    2025年4月24日   

    欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar 数据来源:互联网公开数据 标签:语言处理,数据集,自然语言,机器学习,文本分析,意大利语,代词研究,多语言 数据概述: 该数据集来源于欧洲议会会议记录,专注于意大利语中的代词使用情况。主要特征如下:...
    packageimg
  • 情绪符号情感分析数据集-2015-thomasseleck

    2025年4月24日   

    情绪符号情感分析数据集-2015-thomasseleck 数据来源:互联网公开数据 标签:情绪符号,情感分析,社交媒体,机器学习,自然语言处理,多语言,人类标注,科研 数据概述: 本数据集包含751个情绪符号及其自动分配的情感评分。情感评分是基于来自70,000条推文的分析得出的,这些推文由83位人类标注者在13种欧洲语言中进行标注。...
    packageimg
  • 智利圣地牙哥Airbnb住宿评论数据集-2010至2023年-crisbebop

    2025年4月23日   

    智利圣地牙哥Airbnb住宿评论数据集-2010至2023年-crisbebop 数据来源:互联网公开数据 标签:Airbnb,住宿评论,圣地牙哥,智利,旅游,用户评价,多语言 数据概述:...
    packageimg
  • 英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas

    2025年4月23日   

    英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:...
    packageimg
  • 语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030

    2025年4月23日   

    语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,数据挖掘,人工智能 数据概述: 该数据集包含来自多个语言样本的文本数据,记录了不同语言的文本片段及其对应的语言标签。主要特征如下:...
    packageimg
  • 印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2

    2025年4月23日   

    印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2 数据来源:互联网公开数据 标签:语言混合,数据集,自然语言处理,多语言,机器学习,文本分析,语言研究,翻译技术 数据概述: 该数据集包含来自印地语与英语混合语言环境的数据,记录了两种语言在文本中的混合使用情况。主要特征如下:...
    packageimg
  • Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版

    2025年4月23日   

    Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:...
    packageimg
  • 英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar

    2025年4月23日   

    英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,印地语,英语,自然语言处理,翻译研究,多语言 数据概述: 该数据集包含英语到印地语的翻译对,记录了4000个英语句子及其对应的印地语翻译。主要特征如下:...
    packageimg