找到47个数据集

标签: 多语言处理

过滤结果
  • 有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

    2025年4月25日   

    有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:...
    packageimg
  • 罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-RUSAD-muhammadismail786

    2025年4月25日   

    罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-RUSAD-muhammadismail786 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本挖掘,机器学习,多语言处理,乌尔都语,文本分类 数据概述: 该数据集包含来自罗马乌尔都语的文本数据,记录了不同文本内容的情感倾向。主要特征如下:...
    packageimg
  • 印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki

    2025年4月24日   

    印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:...
    packageimg
  • 印地-英语情感分析数据集HinglishSentimentDataset-ankitlakraa

    2025年4月24日   

    印地-英语情感分析数据集HinglishSentimentDataset-ankitlakraa 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,社交网络,多语言处理,印度市场 数据概述:该数据集包含来自社交媒体平台的印地-英语(Hinglish)文本数据,记录了用户对各种话题的情感表达。主要特征如下:...
    packageimg
  • 俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik

    2025年4月24日   

    俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,风格分析,机器学习,语言研究,情感分析,多语言处理 数据概述: 该数据集包含来自俄罗斯互联网公开来源的文本数据,记录了不同风格和语境下的文本样本。主要特征如下:...
    packageimg
  • 泰米尔语情感分析数据集TamilFirstReadyforSentimentDataset-mayaabasu

    2025年4月24日   

    泰米尔语情感分析数据集TamilFirstReadyforSentimentDataset-mayaabasu 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,泰米尔语,机器学习,文本分类,多语言处理,情感挖掘 数据概述: 该数据集包含泰米尔语的文本数据,专门用于情感分析任务,记录了泰米尔语文本的情感倾向。主要特征如下:...
    packageimg
  • 摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine

    2025年4月24日   

    摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,情感分析,机器学习,自然语言处理,情感研究,多语言处理 数据概述:该数据集包含来自摩洛哥社交媒体平台的推文数据,记录了用户发布的推文内容及情感倾向。主要特征如下:...
    packageimg
  • 机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh

    2025年4月24日   

    机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh 数据来源:互联网公开数据 标签:机器学习,问答系统,印地语,数据集,自然语言处理,文本预处理,多语言处理,语言模型 数据概述: 该数据集包含来自机器学习与问答系统(MLQA)项目的印地语数据,记录了经过预处理的印地语文本内容。主要特征如下:...
    packageimg
  • 印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari

    2025年4月24日   

    印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,双语语料,文本分析,计算机科学,多语言处理 数据概述:...
    packageimg
  • 印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome

    2025年4月24日   

    印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome 数据来源:互联网公开数据 标签:情感分析,印地语,数据集,自然语言处理,文本分类,情感识别,机器学习,多语言处理 数据概述: 该数据集包含来自公开来源的印地语文本数据,记录了不同情感的文本表达。主要特征如下:...
    packageimg
  • 印度公共评论情感分析数据集JantaNLPDataset-vijuc895

    2025年4月24日   

    印度公共评论情感分析数据集JantaNLPDataset-vijuc895 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本挖掘,社交媒体,印度语言,多语言处理 数据概述: 该数据集来自Janta NLP项目,主要包含印度公共平台的评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 印地语维基百科数据集HindiWikipediaDataset-vjdwary

    2025年4月23日   

    印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:...
    packageimg
  • 波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei

    2025年4月23日   

    波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:...
    packageimg
  • 孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas

    2025年4月23日   

    孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,语言技术,机器学习,文本分析,人工智能,多语言处理 数据概述: 该数据集专注于孟加拉语的命名实体识别(NER),包含了大量标注好的孟加拉语文本数据。主要特征如下:...
    packageimg
  • 多语言情感分析数据集MBERT五语言情感分析数据集-pragyanshusingh01

    2025年4月23日   

    多语言情感分析数据集MBERT五语言情感分析数据集-pragyanshusingh01 数据来源:互联网公开数据 标签:多语言处理,情感分析,机器学习,自然语言处理,深度学习,数据集,文本挖掘,多语言情感识别 数据概述:该数据集包含来自多语言情感分析(MBERT 5-Lang...
    packageimg
  • 卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit

    2025年4月23日   

    卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,卡纳达语,数据集,文本分析,机器学习,自然语言处理,多语言处理,信息检索 数据概述: 该数据集记录了卡纳达语新闻文章的分类信息,适用于新闻分类,文本分析和机器学习任务。主要特征如下:...
    packageimg
  • 开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya

    2025年4月23日   

    开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya 数据来源:互联网公开数据 标签:开放域问答,数据集,三语翻译,自然语言处理,机器学习,信息检索,多语言处理,文本分析...
    packageimg
  • 英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69

    2025年4月23日   

    英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言数据,数据集,泰卢固语,英语,自然语言处理,翻译研究,多语言处理 数据概述: 该数据集包含英语到泰卢固语的句子翻译对,记录了大量的双语句子对照数据。主要特征如下:...
    packageimg
  • 语义分析扩展数据集SemEvalExtensionDataset-viciousaegis

    2025年4月23日   

    语义分析扩展数据集SemEvalExtensionDataset-viciousaegis 数据来源:互联网公开数据 标签:语义分析,自然语言处理,数据集,情感分析,机器学习,文本挖掘,多语言处理,信息检索 数据概述: 该数据集源自语义分析与计算语言学国际研讨会(SemEval)的扩展数据,记录了各类文本数据的语义特征和情感倾向。主要特征如下:...
    packageimg
  • 罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-huzzefakhan

    2025年4月22日   

    罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-huzzefakhan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,乌尔都语,多语言处理,情感计算 数据概述: 该数据集包含来自罗马乌尔都语语料库的文本数据,记录了不同来源的文本内容及其情感标签。主要特征如下:...
    packageimg