找到3,840个数据集

标签: 文本分类

过滤结果
  • 土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan

    2025年4月23日   

    土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,自然语言处理,机器学习,文本挖掘,土耳其语,恶意软件 数据概述: 该数据集包含来自土耳其的垃圾邮件和非垃圾邮件电子邮件数据,用于垃圾邮件检测和分类研究。主要特征如下:...
    packageimg
  • 用户反馈训练数据集-black99ylunar

    2025年4月23日   

    用户反馈训练数据集-black99ylunar 数据来源:互联网公开数据 标签:用户反馈,情感分析,自然语言处理,数据集,文本分类,机器学习,情感识别,NLP 数据概述: 该数据集包含了用户对各种产品和服务的反馈信息,主要用于训练情感分析模型。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了较长时间的用户反馈。...
    packageimg
  • 垃圾邮件预测数据集SpamEmailPredictionDataset-himanshikawade04

    2025年4月23日   

    垃圾邮件预测数据集SpamEmailPredictionDataset-himanshikawade04 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,机器学习,文本分类,自然语言处理,数据挖掘,信息安全 数据概述: 该数据集包含来自电子邮件服务的邮件数据,记录了邮件的文本内容和标签信息,用于垃圾邮件的识别和分类。主要特征如下:...
    packageimg
  • 垃圾邮件分类分析邮件正文数据集-tungnv01

    2025年4月23日   

    垃圾邮件分类分析邮件正文数据集-tungnv01 数据来源:互联网公开数据 标签:垃圾邮件,邮件,文本分类,自然语言处理,机器学习,spam,ham,邮件内容,文本数据 数据概述:...
    packageimg
  • 医疗处方数据集自然语言处理任务数据集-2023-bpkapkar

    2025年4月23日   

    医疗处方数据集自然语言处理任务数据集-2023-bpkapkar 数据来源:互联网公开数据 标签:医疗处方,自然语言处理,NLP,机器学习,Spacy,零样本学习,文本分类,临床记录 数据概述:...
    packageimg
  • 新冠疫情推文分类机器学习数据集-gauravduttakiit

    2025年4月23日   

    新冠疫情推文分类机器学习数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新冠疫情,推文,机器学习,情感分析,社交媒体,文本分类,自然语言处理,疫情,Twitter,公共卫生 数据概述:...
    packageimg
  • 垃圾邮件识别数据集SpamDetectionDataset-ripcurl

    2025年4月23日   

    垃圾邮件识别数据集SpamDetectionDataset-ripcurl 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分类,机器学习,自然语言处理,电子邮件,信息安全,数据挖掘 数据概述: 该数据集包含来自电子邮件通信中的大量邮件数据,主要用于垃圾邮件的识别和分类任务。主要特征如下:...
    packageimg
  • 波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei

    2025年4月23日   

    波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:...
    packageimg
  • 情感分析电影评论数据集-zlliu246

    2025年4月23日   

    情感分析电影评论数据集-zlliu246 数据来源:互联网公开数据 标签:情感分析,评论数据,自然语言处理,机器学习,文本分类,电影评论,情感极性,数据集 数据概述: 该数据集包含来自互联网的电影评论数据,主要用于情感分析任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了近期电影评论。 地理范围:...
    packageimg
  • 法律文本分类测试数据集LegalBERTInferTestSet-minh29

    2025年4月23日   

    法律文本分类测试数据集LegalBERTInferTestSet-minh29 数据来源:互联网公开数据 标签:法律文本,文本分类,数据集,自然语言处理,机器学习,法律研究,人工智能,深度学习 数据概述: 该数据集包含用于法律文本分类的测试数据,记录了各类法律文书的文本内容及其分类标签。主要特征如下:...
    packageimg
  • Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版

    2025年4月23日   

    Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:...
    packageimg
  • 网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy

    2025年4月23日   

    网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:网络欺凌,社交媒体,数据集,情感分析,自然语言处理,文本分类,机器学习,心理学研究...
    packageimg
  • 页面区块分类数据集PageBlocksClassificationDataset-nkcong206

    2025年4月23日   

    页面区块分类数据集PageBlocksClassificationDataset-nkcong206 数据来源:互联网公开数据 标签:数据集,机器学习,图像识别,计算机视觉,自然语言处理,文本分类,视觉分析,网页解析 数据概述: 该数据集包含网页页面中不同区块的分类数据,记录了网页结构中的文本,图像,广告,导航等元素的标签信息。主要特征如下:...
    packageimg
  • ISOT虚假新闻检测数据集-2016至2017年-rahulogoel

    2025年4月23日   

    ISOT虚假新闻检测数据集-2016至2017年-rahulogoel 数据来源:互联网公开数据 标签:虚假新闻,真实新闻,文本分类,新闻分析,机器学习,政治新闻,世界新闻,数据清洗 数据概述:...
    packageimg
  • 电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010

    2025年4月23日   

    电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010 数据来源:互联网公开数据 标签:情感分析,文本分类,电影评论,自然语言处理,机器学习,IMDB,二元分类,情感极性,影评,评论 数据概述: 本数据集是IMDB(互联网电影数据库)提供的大规模影评数据集,专门用于二元情感分类任务。...
    packageimg
  • 英国广播公司新闻文本数据集BBCNewsTextDataset-avishi

    2025年4月23日   

    英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:...
    packageimg
  • 虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222

    2025年4月23日   

    虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息检测,机器学习,文本分类,自然语言处理,信息安全,社会研究 数据概述: 该数据集包含来自互联网的真实新闻与虚假新闻数据,记录了新闻文本及相关特征,用于虚假新闻的识别与预测。主要特征如下:...
    packageimg
  • 假新闻检测数据集DetectFakeNewsDataset-sanamps

    2025年4月23日   

    假新闻检测数据集DetectFakeNewsDataset-sanamps 数据来源:互联网公开数据 标签:假新闻,数据集,新闻分析,机器学习,文本分类,信息鉴别,社交媒体,社会研究 数据概述:该数据集包含来自多个来源的新闻文章数据,记录了真实新闻和假新闻的样本。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2023年。...
    packageimg
  • 泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420

    2025年4月23日   

    泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:...
    packageimg
  • 负面评论数据集NegativeCommentsDataset-yuzhe2020

    2025年4月23日   

    负面评论数据集NegativeCommentsDataset-yuzhe2020 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自互联网的负面评论数据,记录了用户在社交媒体,电商平台等平台上的负面评价信息。主要特征如下:...
    packageimg