-
有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281
有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:... -
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-RUSAD-muhammadismail786
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-RUSAD-muhammadismail786 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本挖掘,机器学习,多语言处理,乌尔都语,文本分类 数据概述: 该数据集包含来自罗马乌尔都语的文本数据,记录了不同文本内容的情感倾向。主要特征如下:... -
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:... -
印地-英语情感分析数据集HinglishSentimentDataset-ankitlakraa
印地-英语情感分析数据集HinglishSentimentDataset-ankitlakraa 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,社交网络,多语言处理,印度市场 数据概述:该数据集包含来自社交媒体平台的印地-英语(Hinglish)文本数据,记录了用户对各种话题的情感表达。主要特征如下:... -
俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik
俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,风格分析,机器学习,语言研究,情感分析,多语言处理 数据概述: 该数据集包含来自俄罗斯互联网公开来源的文本数据,记录了不同风格和语境下的文本样本。主要特征如下:... -
泰米尔语情感分析数据集TamilFirstReadyforSentimentDataset-mayaabasu
泰米尔语情感分析数据集TamilFirstReadyforSentimentDataset-mayaabasu 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,泰米尔语,机器学习,文本分类,多语言处理,情感挖掘 数据概述: 该数据集包含泰米尔语的文本数据,专门用于情感分析任务,记录了泰米尔语文本的情感倾向。主要特征如下:... -
摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine
摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,情感分析,机器学习,自然语言处理,情感研究,多语言处理 数据概述:该数据集包含来自摩洛哥社交媒体平台的推文数据,记录了用户发布的推文内容及情感倾向。主要特征如下:... -
机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh
机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh 数据来源:互联网公开数据 标签:机器学习,问答系统,印地语,数据集,自然语言处理,文本预处理,多语言处理,语言模型 数据概述: 该数据集包含来自机器学习与问答系统(MLQA)项目的印地语数据,记录了经过预处理的印地语文本内容。主要特征如下:... -
印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari
印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,双语语料,文本分析,计算机科学,多语言处理 数据概述:... -
印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome
印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome 数据来源:互联网公开数据 标签:情感分析,印地语,数据集,自然语言处理,文本分类,情感识别,机器学习,多语言处理 数据概述: 该数据集包含来自公开来源的印地语文本数据,记录了不同情感的文本表达。主要特征如下:... -
印度公共评论情感分析数据集JantaNLPDataset-vijuc895
印度公共评论情感分析数据集JantaNLPDataset-vijuc895 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本挖掘,社交媒体,印度语言,多语言处理 数据概述: 该数据集来自Janta NLP项目,主要包含印度公共平台的评论数据,用于情感分析任务。主要特征如下:... -
印地语维基百科数据集HindiWikipediaDataset-vjdwary
印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:... -
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:... -
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas
孟加拉语命名实体识别数据集NERBengaliDataset-golammostofas 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,语言技术,机器学习,文本分析,人工智能,多语言处理 数据概述: 该数据集专注于孟加拉语的命名实体识别(NER),包含了大量标注好的孟加拉语文本数据。主要特征如下:... -
多语言情感分析数据集MBERT五语言情感分析数据集-pragyanshusingh01
多语言情感分析数据集MBERT五语言情感分析数据集-pragyanshusingh01 数据来源:互联网公开数据 标签:多语言处理,情感分析,机器学习,自然语言处理,深度学习,数据集,文本挖掘,多语言情感识别 数据概述:该数据集包含来自多语言情感分析(MBERT 5-Lang... -
卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit
卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,卡纳达语,数据集,文本分析,机器学习,自然语言处理,多语言处理,信息检索 数据概述: 该数据集记录了卡纳达语新闻文章的分类信息,适用于新闻分类,文本分析和机器学习任务。主要特征如下:... -
开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya
开放域问答三语数据集ODQATrilingualDataDataset-aninditabhattacharya 数据来源:互联网公开数据 标签:开放域问答,数据集,三语翻译,自然语言处理,机器学习,信息检索,多语言处理,文本分析... -
英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69
英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言数据,数据集,泰卢固语,英语,自然语言处理,翻译研究,多语言处理 数据概述: 该数据集包含英语到泰卢固语的句子翻译对,记录了大量的双语句子对照数据。主要特征如下:... -
语义分析扩展数据集SemEvalExtensionDataset-viciousaegis
语义分析扩展数据集SemEvalExtensionDataset-viciousaegis 数据来源:互联网公开数据 标签:语义分析,自然语言处理,数据集,情感分析,机器学习,文本挖掘,多语言处理,信息检索 数据概述: 该数据集源自语义分析与计算语言学国际研讨会(SemEval)的扩展数据,记录了各类文本数据的语义特征和情感倾向。主要特征如下:... -
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-huzzefakhan
罗马乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-huzzefakhan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,乌尔都语,多语言处理,情感计算 数据概述: 该数据集包含来自罗马乌尔都语语料库的文本数据,记录了不同来源的文本内容及其情感标签。主要特征如下:...