-
葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing
葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,语言模型,机器学习,多语言,文本分析,语言学 数据概述: 该数据集包含来自葡萄牙语互联网的文本数据,专门用于葡萄牙语的文本分类任务。主要特征如下:... -
印度政治推特情感分析数据集-2023-shashankkumarranjan
印度政治推特情感分析数据集-2023-shashankkumarranjan 数据来源:互联网公开数据 标签:推特,情感分析,印度政治,社交媒体,文本分类,数据分析,公众意见 数据概述:... -
电影剧情概述与类型关联分析数据集-hetpatel01
电影剧情概述与类型关联分析数据集-hetpatel01 数据来源:互联网公开数据 标签:电影,类型,剧情,文本分析,自然语言处理,NLP,文本分类,推荐系统,多标签分类 数据概述:... -
跨站脚本攻击XSS检测数据集XSSDetectionDataset-youssefhazemfarouk
跨站脚本攻击XSS检测数据集XSSDetectionDataset-youssefhazemfarouk 数据来源:互联网公开数据 标签:网络安全,数据集,XSS攻击,机器学习,漏洞检测,文本分类,数据挖掘,信息安全 数据概述:... -
虚假与真实新闻分类数据集FakeandTrueNewsClassificationDataset-ramaqubra
虚假与真实新闻分类数据集FakeandTrueNewsClassificationDataset-ramaqubra 数据来源:互联网公开数据 标签:新闻分析,数据集,文本分类,机器学习,自然语言处理,信息传播,媒体研究,数据分析 数据概述:... -
路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek
路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek 数据来源:互联网公开数据 标签:新闻文本,多标签分类,文本分类,路透社,机器学习,自然语言处理,主题分类 数据概述:... -
垃圾邮件检测数据集-文本分类-2023-aiaiaidavid
垃圾邮件检测数据集-文本分类-2023-aiaiaidavid 数据来源:互联网公开数据 标签:垃圾邮件检测,文本分类,机器学习,数据集,训练集,验证集,测试集 数据概述: 本数据集包含三个文件:train.csv、valid.csv 和 test.csv,用于垃圾邮件检测任务。每个文件包含两列:text 和 label。text... -
数据10K电影评论情感分析数据集-amar891
10K电影评论情感分析数据集-amar891 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,文本分类,机器学习,数据集,NLP,舆情分析 数据概述: 该数据集包含了10,000条电影评论数据,用于情感分析任务。主要特征如下: 时间跨度:数据的时间跨度取决于评论发布时间,但主要集中在数据集构建时期。... -
文章分类数据集ArticlesClassificationDataset-mohamedalqblawi
文章分类数据集ArticlesClassificationDataset-mohamedalqblawi 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,数据分析,信息检索,内容分析,智能推荐 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:... -
自然语言处理入门数据集NLPStartedDataset-liangyou
自然语言处理入门数据集NLPStartedDataset-liangyou 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,机器学习,数据集,文本分类,情感分析,语言模型,入门 数据概述: 该数据集包含多个文本数据集,旨在帮助初学者入门自然语言处理领域。主要特征如下:... -
数据10000条样本语言识别数据集-amitverma2030
10000条样本语言识别数据集-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,文本分类,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含10000条文本样本,用于语言识别任务。主要特征如下: 时间跨度:数据无明确的时间范围,为静态数据集。 地理范围:数据涵盖多种语言,文本来源多样。... -
网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe
网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,社交网络,内容审核,有害言论 数据概述: 该数据集来源于Jigsaw组织提供的网络评论数据,记录了互联网平台上的用户评论,并标注了评论的情绪和毒性程度。主要特征如下:... -
阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr
阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,语言模型,机器翻译,阿拉伯语 数据概述: 该数据集包含阿拉伯语文本数据,记录了不同主题和类别的阿拉伯语文章,评论或文档。主要特征如下:... -
挪威语评论情感分析数据集-文本情感分类-2024-ravaghi
挪威语评论情感分析数据集-文本情感分类-2024-ravaghi 数据来源:互联网公开数据 标签:情感分析,文本分类,挪威语,自然语言处理,机器学习,评论,NoReC,情感极性 数据概述:... -
垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar
垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar 数据来源:互联网公开数据 标签:垃圾评论,数据集,文本分类,自然语言处理,机器学习,恶意内容检测,社交媒体,内容审核 数据概述: 该数据集包含来自社交媒体平台的评论数据,用于训练和评估垃圾评论检测模型。主要特征如下:... -
诗歌-议论文及散文文本数据集-huosiyuan
诗歌-议论文及散文文本数据集-huosiyuan 数据来源:互联网公开数据 标签:诗歌,议论文,散文,文本分析,自然语言处理,写作风格,文本分类,教育 数据概述:... -
虚假招聘信息识别数据集-招聘信息文本与元数据-通用-whenamancodes
虚假招聘信息识别数据集-招聘信息文本与元数据-通用-whenamancodes 数据来源:互联网公开数据 标签:招聘,虚假招聘,欺诈,文本分类,自然语言处理,机器学习,就业,数据分析 数据概述:... -
情感分析测试数据集WASSATestAngerFilteredDataset-marouanesidali
情感分析测试数据集WASSATestAngerFilteredDataset-marouanesidali 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,情感识别,心理学,人工智能 数据概述: 该数据集来源于WASSA情感分析挑战赛,专注于愤怒情感的识别。主要特征如下:... -
自然语言处理多分类任务BERTBase越南语数据集NLPMulticlassBERTBaseVietnameseDataset-aeryss
自然语言处理多分类任务BERTBase越南语数据集NLPMulticlassBERTBaseVietnameseDataset-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类任务,BERT模型,越南语,数据集,机器学习,文本分类,人工智能 数据概述:... -
麦比乌斯鲸鱼小说文本数据集MobyDickTextDataset-mmmarchetti
麦比乌斯鲸鱼小说文本数据集MobyDickTextDataset-mmmarchetti 数据来源:互联网公开数据 标签:文学分析,文本挖掘,自然语言处理,数据集,机器学习,文本分类,小说研究,英语文学 数据概述: 该数据集包含来自赫尔曼·梅尔维尔经典小说《白鲸》(Moby Dick)的完整文本数据,记录了小说的全文内容及其相关章节信息。主要特征如下:...