找到3,840个数据集

标签: 文本分类

过滤结果
  • 短信垃圾信息与正常短信分类数据集-poojaparab

    2025年4月22日   

    短信垃圾信息与正常短信分类数据集-poojaparab 数据来源:互联网公开数据 标签:短信,垃圾信息,正常短信,文本分类,自然语言处理,机器学习,数据集 数据概述:...
    packageimg
  • 仇恨言论识别与检测数据集-ToxiGen研究专用-xenowing

    2025年4月22日   

    仇恨言论识别与检测数据集-ToxiGen研究专用-xenowing 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,自然语言处理,文本分类,对抗生成,ToxiGen,少数群体,歧视言论 数据概述:...
    packageimg
  • 网站内容IAB分类数据集-payne18

    2025年4月22日   

    网站内容IAB分类数据集-payne18 数据来源:互联网公开数据 标签:网站分类,IAB,广告,内容分析,机器学习,文本分类,网站,分类 数据概述: 本数据集包含了网站信息,并按照IAB标准(Interactive Advertising...
    packageimg
  • BBC新闻文章分类数据集-2000s至2010s-willianoliveiragibin

    2025年4月22日   

    BBC新闻文章分类数据集-2000s至2010s-willianoliveiragibin 数据来源:互联网公开数据 标签:BBC,新闻,文本分类,自然语言处理,机器学习,情感分析,政治,体育,娱乐,科技,商业 数据概述:...
    packageimg
  • 俄罗斯电商平台用户评论情感分析数据集-nikee7

    2025年4月22日   

    俄罗斯电商平台用户评论情感分析数据集-nikee7 数据来源:互联网公开数据 标签:情感分析,文本分类,俄语,电商,用户评论,NLP,自然语言处理 数据概述:...
    packageimg
  • 科学孟加拉语文本分类数据集-2023-fahmidanahiyan

    2025年4月22日   

    科学孟加拉语文本分类数据集-2023-fahmidanahiyan 数据来源:互联网公开数据 标签:科学文本,孟加拉语,文本分类,物理学,化学,生物学,信息技术,数学,其他科学 数据概述:...
    packageimg
  • 英语仇恨言论超集数据集

    2025年4月22日   

    英语仇恨言论超集数据集 数据来源:互联网公开数据 标签:仇恨言论,英语,社交媒体,自然语言处理,文本分类,歧视语言,偏见分析,数据集合并 数据概述...
    packageimg
  • 全球新闻话题分类数据集-2004至2005年-vrindakallu

    2025年4月22日   

    全球新闻话题分类数据集-2004至2005年-vrindakallu 数据来源:互联网公开数据 标签:新闻分类,话题分类,新闻源,文本分类,机器学习,学术数据,AG数据集 数据概述:...
    packageimg
  • 社交媒体用户对科技产品的情感分析数据集-anmolkumar

    2025年4月22日   

    社交媒体用户对科技产品的情感分析数据集-anmolkumar 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分类, 自然语言处理, 机器学习, 科技产品, 负面情绪, 文本数据 数据概述:...
    packageimg
  • 虚假新闻检测文本分类数据集-2023-pnkjgpt

    2025年4月22日   

    虚假新闻检测文本分类数据集-2023-pnkjgpt 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,数据竞赛,数据集,训练集,测试集,机器学习 数据概述:...
    packageimg
  • COVID-19假新闻识别训练数据集-2021-gyuntian

    2025年4月22日   

    COVID-19假新闻识别训练数据集-2021-gyuntian 数据来源:互联网公开数据 标签:COVID-19,假新闻,数据集,机器学习,文本分类,训练数据,健康信息,开源数据 数据概述: 本数据集包含用于训练COVID-19假新闻识别模型的数据,来源包括Google...
    packageimg
  • 商业新闻文章分类数据集-多种商业事件-2024-arpytanshu

    2025年4月22日   

    商业新闻文章分类数据集-多种商业事件-2024-arpytanshu 数据来源:互联网公开数据 标签:商业新闻,文本分类,财经,新闻文章,产品,并购,盈利,劳工,法律,合作,投资 数据概述:...
    packageimg
  • 新闻文本分类预测数据集-gauravduttakiit

    2025年4月22日   

    新闻文本分类预测数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,多分类,新闻分类,文本分析 数据概述: 本数据集包含用于新闻文本分类任务的样本数据。 数据集由新闻标题和新闻正文片段组成,并为每条新闻分配了一个类别标签。 类别标签代表新闻的主题或类别,例如:体育、科技、政治、经济、娱乐等。...
    packageimg
  • 大规模文本数据集分析报告

    2025年4月22日   

    标题:大规模文本数据集分析报告 数据内容: 该数据集包含两个主要字段: 1. text:包含487,235种不同的文本值,覆盖了广泛的文本内容,可能是从互联网公开数据中提取的。 2. generated:包含2种不同的值,可能是二元分类字段(例如,"是"或"否"),用于标识文本是否为生成内容。 数据来源:互联网公开数据 数据用途: 1....
    packageimg
  • 大规模文本分类数据集详述

    2025年4月22日   

    标题:大规模文本分类数据集详述 数据内容:该数据集包含了三个主要的数据元素,分别是评论内容(clean_comment)、文本内容(clean_text)和分类标签(category)。其中,评论内容有36,801种不同的值,文本内容有162,977种不同的值,分类标签有3种不同的值。数据集整体规模较大,适合用于文本分类、情感分析等任务。...
    packageimg
  • 大规模文本分类数据集

    2025年4月22日   

    标题:大规模文本分类数据集 数据内容: 本数据集包含232074条独特的文本数据,每条文本都有对应的分类标签。数据集包含以下字段: - text:文本内容 - class:文本类别(2种不同值) 数据来源: 互联网公开数据 数据用途: 该数据集适用于多个行业的文本分类任务: - 人工智能行业:训练文本分类模型 - 大数据行业:进行文本挖掘和自然语言处理...
    packageimg
  • 英文电影字幕数据集

    2025年4月22日   

    英文电影字幕数据集 数据来源:互联网公开数据 标签:电影字幕,英文电影,自然语言处理,语言建模,情感分析,机器学习,文本分类 数据概述: 本数据集包含了多部英文电影的字幕内容,涵盖广泛的主题和类型。数据集中的字幕以文本形式呈现,记录了电影中的对话、背景音及其他音频信息,为自然语言处理和机器学习提供丰富的语料支持。 数据用途概述:...
    packageimg
  • 软件需求分类数据集-PURE-computerscience3

    2025年4月22日   

    软件需求分类数据集-PURE-computerscience3 数据来源:互联网公开数据 标签:软件需求,功能需求,非功能需求,数据分析,机器学习,文本分类,软件工程 数据概述:...
    packageimg
  • 迷你日常对话行为识别数据集-as3eem

    2025年4月22日   

    迷你日常对话行为识别数据集-as3eem 数据来源:互联网公开数据 标签:对话,行为识别,自然语言处理,NLU,文本分类,教育,训练集,测试集 数据概述: 本数据集是针对自然语言理解(NLU)任务而设计的一个小型、经过处理的Daily...
    packageimg
  • 孟加拉语新闻数据集

    2025年4月22日   

    孟加拉语新闻数据集 数据来源:互联网公开数据 标签:新闻文本,孟加拉语,文本分类,文本摘要,自然语言处理 数据概述:...
    packageimg