-
短信垃圾信息与正常短信分类数据集-poojaparab
短信垃圾信息与正常短信分类数据集-poojaparab 数据来源:互联网公开数据 标签:短信,垃圾信息,正常短信,文本分类,自然语言处理,机器学习,数据集 数据概述:... -
仇恨言论识别与检测数据集-ToxiGen研究专用-xenowing
仇恨言论识别与检测数据集-ToxiGen研究专用-xenowing 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,自然语言处理,文本分类,对抗生成,ToxiGen,少数群体,歧视言论 数据概述:... -
网站内容IAB分类数据集-payne18
网站内容IAB分类数据集-payne18 数据来源:互联网公开数据 标签:网站分类,IAB,广告,内容分析,机器学习,文本分类,网站,分类 数据概述: 本数据集包含了网站信息,并按照IAB标准(Interactive Advertising... -
BBC新闻文章分类数据集-2000s至2010s-willianoliveiragibin
BBC新闻文章分类数据集-2000s至2010s-willianoliveiragibin 数据来源:互联网公开数据 标签:BBC,新闻,文本分类,自然语言处理,机器学习,情感分析,政治,体育,娱乐,科技,商业 数据概述:... -
俄罗斯电商平台用户评论情感分析数据集-nikee7
俄罗斯电商平台用户评论情感分析数据集-nikee7 数据来源:互联网公开数据 标签:情感分析,文本分类,俄语,电商,用户评论,NLP,自然语言处理 数据概述:... -
科学孟加拉语文本分类数据集-2023-fahmidanahiyan
科学孟加拉语文本分类数据集-2023-fahmidanahiyan 数据来源:互联网公开数据 标签:科学文本,孟加拉语,文本分类,物理学,化学,生物学,信息技术,数学,其他科学 数据概述:... -
-
全球新闻话题分类数据集-2004至2005年-vrindakallu
全球新闻话题分类数据集-2004至2005年-vrindakallu 数据来源:互联网公开数据 标签:新闻分类,话题分类,新闻源,文本分类,机器学习,学术数据,AG数据集 数据概述:... -
社交媒体用户对科技产品的情感分析数据集-anmolkumar
社交媒体用户对科技产品的情感分析数据集-anmolkumar 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分类, 自然语言处理, 机器学习, 科技产品, 负面情绪, 文本数据 数据概述:... -
虚假新闻检测文本分类数据集-2023-pnkjgpt
虚假新闻检测文本分类数据集-2023-pnkjgpt 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,数据竞赛,数据集,训练集,测试集,机器学习 数据概述:... -
COVID-19假新闻识别训练数据集-2021-gyuntian
COVID-19假新闻识别训练数据集-2021-gyuntian 数据来源:互联网公开数据 标签:COVID-19,假新闻,数据集,机器学习,文本分类,训练数据,健康信息,开源数据 数据概述: 本数据集包含用于训练COVID-19假新闻识别模型的数据,来源包括Google... -
商业新闻文章分类数据集-多种商业事件-2024-arpytanshu
商业新闻文章分类数据集-多种商业事件-2024-arpytanshu 数据来源:互联网公开数据 标签:商业新闻,文本分类,财经,新闻文章,产品,并购,盈利,劳工,法律,合作,投资 数据概述:... -
新闻文本分类预测数据集-gauravduttakiit
新闻文本分类预测数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,多分类,新闻分类,文本分析 数据概述: 本数据集包含用于新闻文本分类任务的样本数据。 数据集由新闻标题和新闻正文片段组成,并为每条新闻分配了一个类别标签。 类别标签代表新闻的主题或类别,例如:体育、科技、政治、经济、娱乐等。... -
大规模文本数据集分析报告
标题:大规模文本数据集分析报告 数据内容: 该数据集包含两个主要字段: 1. text:包含487,235种不同的文本值,覆盖了广泛的文本内容,可能是从互联网公开数据中提取的。 2. generated:包含2种不同的值,可能是二元分类字段(例如,"是"或"否"),用于标识文本是否为生成内容。 数据来源:互联网公开数据 数据用途: 1.... -
大规模文本分类数据集详述
标题:大规模文本分类数据集详述 数据内容:该数据集包含了三个主要的数据元素,分别是评论内容(clean_comment)、文本内容(clean_text)和分类标签(category)。其中,评论内容有36,801种不同的值,文本内容有162,977种不同的值,分类标签有3种不同的值。数据集整体规模较大,适合用于文本分类、情感分析等任务。... -
大规模文本分类数据集
标题:大规模文本分类数据集 数据内容: 本数据集包含232074条独特的文本数据,每条文本都有对应的分类标签。数据集包含以下字段: - text:文本内容 - class:文本类别(2种不同值) 数据来源: 互联网公开数据 数据用途: 该数据集适用于多个行业的文本分类任务: - 人工智能行业:训练文本分类模型 - 大数据行业:进行文本挖掘和自然语言处理... -
英文电影字幕数据集
英文电影字幕数据集 数据来源:互联网公开数据 标签:电影字幕,英文电影,自然语言处理,语言建模,情感分析,机器学习,文本分类 数据概述: 本数据集包含了多部英文电影的字幕内容,涵盖广泛的主题和类型。数据集中的字幕以文本形式呈现,记录了电影中的对话、背景音及其他音频信息,为自然语言处理和机器学习提供丰富的语料支持。 数据用途概述:... -
软件需求分类数据集-PURE-computerscience3
软件需求分类数据集-PURE-computerscience3 数据来源:互联网公开数据 标签:软件需求,功能需求,非功能需求,数据分析,机器学习,文本分类,软件工程 数据概述:... -
迷你日常对话行为识别数据集-as3eem
迷你日常对话行为识别数据集-as3eem 数据来源:互联网公开数据 标签:对话,行为识别,自然语言处理,NLU,文本分类,教育,训练集,测试集 数据概述: 本数据集是针对自然语言理解(NLU)任务而设计的一个小型、经过处理的Daily... -