找到3,936个数据集

标签: 文本分类

过滤结果
  • 预训练标签数据集Pred-trainTagsDataset-ananyaajoshi

    2025年4月25日   

    预训练标签数据集Pred-trainTagsDataset-ananyaajoshi 数据来源:互联网公开数据 标签:预训练,标签,数据集,自然语言处理,文本分类,信息检索,机器学习,深度学习 数据概述: 该数据集包含了用于预训练的标签数据,旨在支持各种自然语言处理任务,例如文本分类,信息检索等。主要特征如下: 时间跨度:...
    packageimg
  • IMDB电影评论情感分析数据集IMDBReviewsSentimentAnalysisDataset-sureshvj

    2025年4月25日   

    IMDB电影评论情感分析数据集IMDBReviewsSentimentAnalysisDataset-sureshvj 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能 数据概述:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon

    2025年4月25日   

    垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,数据分析,信息安全 数据概述:...
    packageimg
  • 土耳其虚假新闻数据集TurkishFakeNewsDataset-atakanak

    2025年4月25日   

    土耳其虚假新闻数据集TurkishFakeNewsDataset-atakanak 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,文本分类,机器学习,自然语言处理,新闻媒体,信息传播 数据概述: 该数据集包含来自土耳其公开新闻平台的数据,记录了土耳其新闻媒体中的虚假新闻内容及相关特征。主要特征如下:...
    packageimg
  • IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12

    2025年4月25日   

    IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分类,情感计算,大数据 数据概述:...
    packageimg
  • 恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio

    2025年4月25日   

    恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio 数据来源:互联网公开数据 标签:文本分类,作者识别,数据集,机器学习,自然语言处理,文学分析,数据挖掘,人工智能 数据概述: 该数据集包含来自三位恐怖小说作家的文本数据,主要用于作者身份识别和文本分类任务。主要特征如下:...
    packageimg
  • 土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin

    2025年4月25日   

    土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻分析,数据集,自然语言处理,文本分类,机器学习,新闻媒体,土耳其,多语言 数据概述: 该数据集包含来自土耳其知名新闻媒体Son D News的新闻文章数据,记录了该媒体发布的新闻内容。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1

    2025年4月25日   

    电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,文本分类,数据集,情感倾向,电影行业 数据概述:该数据集包含来自互联网的电影评论数据,主要用于情感分析任务,旨在识别电影评论中的情感倾向。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件检测数据集-salonimourya

    2025年4月25日   

    电子邮件垃圾邮件检测数据集-salonimourya 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,自然语言处理,机器学习,信息检索,数据挖掘 数据概述: 该数据集包含电子邮件数据,用于垃圾邮件检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了电子邮件产生的历史数据。...
    packageimg
  • 金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058

    2025年4月25日   

    金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058 数据来源:互联网公开数据 标签:情感分析,金融新闻,数据集,自然语言处理,机器学习,文本挖掘,金融科技,文本分类 数据概述:...
    packageimg
  • 发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal

    2025年4月25日   

    发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal 数据来源:互联网公开数据 标签:发票分析,商品分类,数据集,自然语言处理,机器学习,销售分析,商业智能,文本分类 数据概述: 该数据集包含来自商业交易发票的商品信息,记录了不同发票中商品的类别和相关信息。主要特征如下:...
    packageimg
  • 有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

    2025年4月25日   

    有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:...
    packageimg
  • 文本领域分类数据集-gauravduttakiit

    2025年4月25日   

    文本领域分类数据集-gauravduttakiit 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,数据集,领域识别,数据挖掘,文本分析,人工智能 数据概述: 该数据集包含用于文本领域分类的数据,记录了不同文本内容所属的领域信息。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的文本数据。...
    packageimg
  • 文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava

    2025年4月25日   

    文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava 数据来源:互联网公开数据 标签:文档处理,数据集,文本分类,自然语言处理,机器学习,信息检索,文本分析,数据挖掘 数据概述: 该数据集包含经过过滤和分类的文档数据,记录了各类文档的文本内容和分类标签。主要特征如下: 时间跨度:...
    packageimg
  • 二十新闻组文本分类数据集-thedevastator

    2025年4月21日   

    二十新闻组文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,新闻组,机器学习,数据集,自然语言处理,文本分析 数据概述: 本数据集包含约20,000篇新闻组文档,这些文档被分为20个不同的新闻组。数据集最初由Ken...
    packageimg
  • 垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg

    2025年4月25日   

    垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg 数据来源:互联网公开数据 标签:文本分类,垃圾短信,数据集,自然语言处理,机器学习,数据挖掘,通信安全,信息安全 数据概述:...
    packageimg
  • 社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar

    2025年4月25日   

    社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,数据集,自然语言处理,机器学习,文本分类,情感分析,网络安全 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的内容中是否包含仇恨言论的标注信息。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集IMDBReviewsDataset-gulsendemir

    2025年4月25日   

    电影评论情感分析数据集IMDBReviewsDataset-gulsendemir 数据来源:互联网公开数据 标签:情感分析,电影评论,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能 数据概述:该数据集包含来自IMDB(互联网电影数据库)的电影评论数据,记录了大量用户对电影的评价和情感倾向。主要特征如下:...
    packageimg
  • 乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab

    2025年4月25日   

    乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:...
    packageimg
  • 自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound

    2025年4月25日   

    自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述: 该数据集用于自然语言处理的入门学习和研究,记录了多种文本数据及相应的标注信息。主要特征如下:...
    packageimg