找到3,936个数据集

标签: 文本分类

过滤结果
  • 垃圾邮件分类分析邮件正文数据集-tungnv01

    2025年4月23日   

    垃圾邮件分类分析邮件正文数据集-tungnv01 数据来源:互联网公开数据 标签:垃圾邮件,邮件,文本分类,自然语言处理,机器学习,spam,ham,邮件内容,文本数据 数据概述:...
    packageimg
  • 医疗处方数据集自然语言处理任务数据集-2023-bpkapkar

    2025年4月23日   

    医疗处方数据集自然语言处理任务数据集-2023-bpkapkar 数据来源:互联网公开数据 标签:医疗处方,自然语言处理,NLP,机器学习,Spacy,零样本学习,文本分类,临床记录 数据概述:...
    packageimg
  • 新冠疫情推文分类机器学习数据集-gauravduttakiit

    2025年4月23日   

    新冠疫情推文分类机器学习数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新冠疫情,推文,机器学习,情感分析,社交媒体,文本分类,自然语言处理,疫情,Twitter,公共卫生 数据概述:...
    packageimg
  • 垃圾邮件识别数据集SpamDetectionDataset-ripcurl

    2025年4月23日   

    垃圾邮件识别数据集SpamDetectionDataset-ripcurl 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分类,机器学习,自然语言处理,电子邮件,信息安全,数据挖掘 数据概述: 该数据集包含来自电子邮件通信中的大量邮件数据,主要用于垃圾邮件的识别和分类任务。主要特征如下:...
    packageimg
  • 波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei

    2025年4月23日   

    波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:...
    packageimg
  • 法律文本分类测试数据集LegalBERTInferTestSet-minh29

    2025年4月23日   

    法律文本分类测试数据集LegalBERTInferTestSet-minh29 数据来源:互联网公开数据 标签:法律文本,文本分类,数据集,自然语言处理,机器学习,法律研究,人工智能,深度学习 数据概述: 该数据集包含用于法律文本分类的测试数据,记录了各类法律文书的文本内容及其分类标签。主要特征如下:...
    packageimg
  • Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版

    2025年4月23日   

    Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:...
    packageimg
  • 网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy

    2025年4月23日   

    网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:网络欺凌,社交媒体,数据集,情感分析,自然语言处理,文本分类,机器学习,心理学研究...
    packageimg
  • 页面区块分类数据集PageBlocksClassificationDataset-nkcong206

    2025年4月23日   

    页面区块分类数据集PageBlocksClassificationDataset-nkcong206 数据来源:互联网公开数据 标签:数据集,机器学习,图像识别,计算机视觉,自然语言处理,文本分类,视觉分析,网页解析 数据概述: 该数据集包含网页页面中不同区块的分类数据,记录了网页结构中的文本,图像,广告,导航等元素的标签信息。主要特征如下:...
    packageimg
  • ISOT虚假新闻检测数据集-2016至2017年-rahulogoel

    2025年4月23日   

    ISOT虚假新闻检测数据集-2016至2017年-rahulogoel 数据来源:互联网公开数据 标签:虚假新闻,真实新闻,文本分类,新闻分析,机器学习,政治新闻,世界新闻,数据清洗 数据概述:...
    packageimg
  • 电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010

    2025年4月23日   

    电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010 数据来源:互联网公开数据 标签:情感分析,文本分类,电影评论,自然语言处理,机器学习,IMDB,二元分类,情感极性,影评,评论 数据概述: 本数据集是IMDB(互联网电影数据库)提供的大规模影评数据集,专门用于二元情感分类任务。...
    packageimg
  • 英国广播公司新闻文本数据集BBCNewsTextDataset-avishi

    2025年4月23日   

    英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:...
    packageimg
  • 虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222

    2025年4月23日   

    虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息检测,机器学习,文本分类,自然语言处理,信息安全,社会研究 数据概述: 该数据集包含来自互联网的真实新闻与虚假新闻数据,记录了新闻文本及相关特征,用于虚假新闻的识别与预测。主要特征如下:...
    packageimg
  • 假新闻检测数据集DetectFakeNewsDataset-sanamps

    2025年4月23日   

    假新闻检测数据集DetectFakeNewsDataset-sanamps 数据来源:互联网公开数据 标签:假新闻,数据集,新闻分析,机器学习,文本分类,信息鉴别,社交媒体,社会研究 数据概述:该数据集包含来自多个来源的新闻文章数据,记录了真实新闻和假新闻的样本。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2023年。...
    packageimg
  • 泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420

    2025年4月23日   

    泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:...
    packageimg
  • 负面评论数据集NegativeCommentsDataset-yuzhe2020

    2025年4月23日   

    负面评论数据集NegativeCommentsDataset-yuzhe2020 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自互联网的负面评论数据,记录了用户在社交媒体,电商平台等平台上的负面评价信息。主要特征如下:...
    packageimg
  • 问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat

    2025年4月23日   

    问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,命令识别,问题分析,语言模型,智能问答 数据概述:...
    packageimg
  • 垃圾短信检测数据集SMSSpamDataset-hanzvivatma

    2025年4月23日   

    垃圾短信检测数据集SMSSpamDataset-hanzvivatma 数据来源:互联网公开数据 标签:文本分类,垃圾短信,自然语言处理,机器学习,数据集,短信,NLP,文本分析 数据概述: 该数据集包含了大量短信文本数据,用于垃圾短信的检测与识别。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了短信内容在一定时间内的收集。 地理范围:...
    packageimg
  • 灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3

    2025年4月23日   

    灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3 数据来源:互联网公开数据 标签:自然语言处理,灾害应急,文本分类,数据集,机器学习,信息检索,危机管理,社会媒体分析 数据概述:该数据集包含来自Twitter的推文数据,记录了与灾害事件相关的文本信息。主要特征如下:...
    packageimg
  • 有毒评论测试数据集-husanrahmatullayev

    2025年4月23日   

    有毒评论测试数据集-husanrahmatullayev 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,有毒内容,机器学习,评论数据,文本分类 数据概述: 该数据集包含用于测试有毒评论检测模型的文本数据,记录了各种类型的在线评论,并标注了其毒性。主要特征如下:...
    packageimg