-
土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan
土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,自然语言处理,机器学习,文本挖掘,土耳其语,恶意软件 数据概述: 该数据集包含来自土耳其的垃圾邮件和非垃圾邮件电子邮件数据,用于垃圾邮件检测和分类研究。主要特征如下:... -
用户反馈训练数据集-black99ylunar
用户反馈训练数据集-black99ylunar 数据来源:互联网公开数据 标签:用户反馈,情感分析,自然语言处理,数据集,文本分类,机器学习,情感识别,NLP 数据概述: 该数据集包含了用户对各种产品和服务的反馈信息,主要用于训练情感分析模型。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了较长时间的用户反馈。... -
垃圾邮件预测数据集SpamEmailPredictionDataset-himanshikawade04
垃圾邮件预测数据集SpamEmailPredictionDataset-himanshikawade04 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,机器学习,文本分类,自然语言处理,数据挖掘,信息安全 数据概述: 该数据集包含来自电子邮件服务的邮件数据,记录了邮件的文本内容和标签信息,用于垃圾邮件的识别和分类。主要特征如下:... -
垃圾邮件分类分析邮件正文数据集-tungnv01
垃圾邮件分类分析邮件正文数据集-tungnv01 数据来源:互联网公开数据 标签:垃圾邮件,邮件,文本分类,自然语言处理,机器学习,spam,ham,邮件内容,文本数据 数据概述:... -
医疗处方数据集自然语言处理任务数据集-2023-bpkapkar
医疗处方数据集自然语言处理任务数据集-2023-bpkapkar 数据来源:互联网公开数据 标签:医疗处方,自然语言处理,NLP,机器学习,Spacy,零样本学习,文本分类,临床记录 数据概述:... -
新冠疫情推文分类机器学习数据集-gauravduttakiit
新冠疫情推文分类机器学习数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新冠疫情,推文,机器学习,情感分析,社交媒体,文本分类,自然语言处理,疫情,Twitter,公共卫生 数据概述:... -
垃圾邮件识别数据集SpamDetectionDataset-ripcurl
垃圾邮件识别数据集SpamDetectionDataset-ripcurl 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分类,机器学习,自然语言处理,电子邮件,信息安全,数据挖掘 数据概述: 该数据集包含来自电子邮件通信中的大量邮件数据,主要用于垃圾邮件的识别和分类任务。主要特征如下:... -
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:... -
情感分析电影评论数据集-zlliu246
情感分析电影评论数据集-zlliu246 数据来源:互联网公开数据 标签:情感分析,评论数据,自然语言处理,机器学习,文本分类,电影评论,情感极性,数据集 数据概述: 该数据集包含来自互联网的电影评论数据,主要用于情感分析任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了近期电影评论。 地理范围:... -
法律文本分类测试数据集LegalBERTInferTestSet-minh29
法律文本分类测试数据集LegalBERTInferTestSet-minh29 数据来源:互联网公开数据 标签:法律文本,文本分类,数据集,自然语言处理,机器学习,法律研究,人工智能,深度学习 数据概述: 该数据集包含用于法律文本分类的测试数据,记录了各类法律文书的文本内容及其分类标签。主要特征如下:... -
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:... -
网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy
网络欺凌评论数据集CyberbullyingCommentsDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:网络欺凌,社交媒体,数据集,情感分析,自然语言处理,文本分类,机器学习,心理学研究... -
页面区块分类数据集PageBlocksClassificationDataset-nkcong206
页面区块分类数据集PageBlocksClassificationDataset-nkcong206 数据来源:互联网公开数据 标签:数据集,机器学习,图像识别,计算机视觉,自然语言处理,文本分类,视觉分析,网页解析 数据概述: 该数据集包含网页页面中不同区块的分类数据,记录了网页结构中的文本,图像,广告,导航等元素的标签信息。主要特征如下:... -
ISOT虚假新闻检测数据集-2016至2017年-rahulogoel
ISOT虚假新闻检测数据集-2016至2017年-rahulogoel 数据来源:互联网公开数据 标签:虚假新闻,真实新闻,文本分类,新闻分析,机器学习,政治新闻,世界新闻,数据清洗 数据概述:... -
电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010
电影评论情感分析数据集-IMDB大规模影评数据集-二元情感分类-电影评论-情感分析-电影-2010 数据来源:互联网公开数据 标签:情感分析,文本分类,电影评论,自然语言处理,机器学习,IMDB,二元分类,情感极性,影评,评论 数据概述: 本数据集是IMDB(互联网电影数据库)提供的大规模影评数据集,专门用于二元情感分类任务。... -
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi
英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:... -
虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222
虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息检测,机器学习,文本分类,自然语言处理,信息安全,社会研究 数据概述: 该数据集包含来自互联网的真实新闻与虚假新闻数据,记录了新闻文本及相关特征,用于虚假新闻的识别与预测。主要特征如下:... -
假新闻检测数据集DetectFakeNewsDataset-sanamps
假新闻检测数据集DetectFakeNewsDataset-sanamps 数据来源:互联网公开数据 标签:假新闻,数据集,新闻分析,机器学习,文本分类,信息鉴别,社交媒体,社会研究 数据概述:该数据集包含来自多个来源的新闻文章数据,记录了真实新闻和假新闻的样本。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2023年。... -
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:... -
负面评论数据集NegativeCommentsDataset-yuzhe2020
负面评论数据集NegativeCommentsDataset-yuzhe2020 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自互联网的负面评论数据,记录了用户在社交媒体,电商平台等平台上的负面评价信息。主要特征如下:...