找到3,840个数据集

标签: 文本分类

过滤结果
  • 新闻真伪辨识数据集-互联网新闻与GPT-2生成文本-训练-验证-测试

    2025年4月21日   

    新闻真伪辨识数据集-互联网新闻与GPT-2生成文本-训练-验证-测试 数据来源:互联网公开数据 标签:假新闻,真新闻,文本分类,自然语言处理,机器学习,GPT-2,新闻,文本数据 数据概述:...
    packageimg
  • 新闻分类即时与非即时新闻文章数据集-yomnamuhammad

    2025年4月21日   

    新闻分类即时与非即时新闻文章数据集-yomnamuhammad 数据来源:互联网公开数据 标签:新闻,文本分类,即时新闻,非即时新闻,数据集,自然语言处理,机器学习 数据概述: 本数据集包含了即时新闻和非即时新闻的文章,适用于文本分类任务。数据集中的文章涵盖了不同类别,包括但不限于时事报道、评论、分析文章等,为训练文本分类模型提供了丰富的数据支持。...
    packageimg
  • 新闻真伪辨别数据集-标题文本与标签-2024-amirmotefaker

    2025年4月21日   

    新闻真伪辨别数据集-标题文本与标签-2024-amirmotefaker 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,文本分析,自然语言处理,机器学习,文本分类,标题,文本 数据概述: 本数据集旨在用于新闻真伪辨别研究与实践,包含了大量新闻标题、正文文本及对应的真伪标签。 数据集共包含7796条新闻样本,每条样本由四个字段构成:...
    packageimg
  • 美国航空公司推特评论情感分析数据集-预测模型构建2015年-ishaanraina

    2025年4月21日   

    美国航空公司推特评论情感分析数据集-预测模型构建2015年-ishaanraina 数据来源:互联网公开数据 标签:航空公司,推特,情感分析,文本分类,机器学习,预测模型,社交媒体,用户评论,自然语言处理,美国 数据概述:...
    packageimg
  • 伊斯兰议题事实核查与虚假信息识别数据集-suhaibkhalil

    2025年4月21日   

    伊斯兰议题事实核查与虚假信息识别数据集-suhaibkhalil 数据来源:互联网公开数据 标签:伊斯兰,虚假信息,事实核查,文本分类,社交媒体,深度学习,宗教,新闻,舆情分析 数据概述: 本数据集是一个二元分类数据集,主要用于识别与伊斯兰议题相关的正确信息和虚假信息。数据集来源于一项研究(DISINFORMATION DETECTION ABOUT...
    packageimg
  • 创意文本生成数据集

    2025年4月21日   

    标题:创意文本生成数据集 数据内容:本数据集包含了三个主要字段,分别是name、prompt和negative_prompt。具体统计信息如下: - name字段包含31种不同的值,表示不同的生成主题或类别。 - prompt字段包含29种不同的值,表示用于生成创意文本的提示信息。 -...
    packageimg
  • 阿拉伯语社交媒体文本讽刺检测数据集-mohamedabi

    2025年4月21日   

    阿拉伯语社交媒体文本讽刺检测数据集-mohamedabi 数据来源:互联网公开数据 标签:阿拉伯语,社交媒体,讽刺,情感分析,自然语言处理,机器学习,文本分类,数据挖掘 数据概述: 本数据集旨在支持阿拉伯语文本中的讽刺检测任务。 讽刺检测是情感分析领域的一个重要挑战,因为讽刺言语通常使用积极的表达方式来传达负面情绪。...
    packageimg
  • 音乐艺术家推文演唱会信息标注数据集-alejandroservin

    2025年4月21日   

    音乐艺术家推文演唱会信息标注数据集-alejandroservin 数据来源:互联网公开数据 标签:推文,音乐,艺术家,演唱会,公告,社交媒体,自然语言处理,图像识别,文本分类,机器学习 数据概述:...
    packageimg
  • 土耳其情绪分析数据集-2023-alpcansoydas

    2025年4月21日   

    土耳其情绪分析数据集-2023-alpcansoydas 数据来源:互联网公开数据 标签:情绪分析,土耳其,情感识别,自然语言处理,文本分类,机器学习,数据集 数据概述: 本数据集用于土耳其情绪分析,包含6个情绪标签:愤怒、恐惧、快乐、厌恶、悲伤和惊讶。数据集整合了以下两个来源的数据集: -...
    packageimg
  • 科研论文主题分类数据集-计算机科学-物理-数学-统计学-生物学-金融学-vetrirah

    2025年4月21日   

    科研论文主题分类数据集-计算机科学-物理-数学-统计学-生物学-金融学-vetrirah 数据来源:互联网公开数据 标签:科研论文,主题模型,自然语言处理,文本分类,机器学习,计算机科学,物理学,数学,统计学,生物学,金融学 数据概述:...
    packageimg
  • 虚假新闻识别-ISOT虚假新闻数据集-islamic

    2025年4月21日   

    虚假新闻识别-ISOT虚假新闻数据集-islamic 数据来源:互联网公开数据 标签:虚假新闻, 真实新闻, 新闻文章, 文本分类, 自然语言处理, 政治新闻, 世界新闻, 数据集, 文本分析 数据概述:...
    packageimg
  • 抑郁症分类数据集-2022-vhonghoavin

    2025年4月21日   

    抑郁症分类数据集-2022-vhonghoavin 数据来源:互联网公开数据 标签:抑郁症,情感分析,自然语言处理,机器学习,心理健康,数据预处理,文本分类 数据概述: 本数据集源自DepSign-LT-...
    packageimg
  • 自然语言处理-职业意图项目数据集

    2025年4月21日   

    自然语言处理-职业意图项目数据集 数据来源:互联网公开数据 标签:自然语言处理,职业意图,文本分类,模型训练,数据集,机器学习,深度学习 数据概述:...
    packageimg
  • 航空安全报告文本分类数据集

    2025年4月21日   

    航空安全报告文本分类数据集 数据来源:互联网公开数据 标签:航空安全, 文本分类, 事件分析, 问题类型, 飞行事故, 数据挖掘, 机器学习 数据概述...
    packageimg
  • 虚假新闻识别文本数据集

    2025年4月21日   

    虚假新闻识别文本数据集 数据来源:互联网公开数据 标签:虚假新闻,新闻文本,自然语言处理,文本分类,机器学习,舆情分析,新闻真伪,网络安全 数据概述: 本数据集来源于《机器学习在网络安全中的应用》一书的第四章,包含了虚假新闻和真实新闻文章的集合。数据集旨在为研究人员和实践者提供一个用于虚假新闻检测和分析的资源。 数据用途概述:...
    packageimg
  • 英文小说文本数据集

    2025年4月21日   

    英文小说文本数据集 数据来源:互联网公开数据 标签:英文小说,自然语言处理,NLP,文本分类,文本摘要,文学作品,预处理,内容过滤 数据概述: 本数据集包含一系列英文小说文本,适用于自然语言处理(NLP)任务,例如文本分类、文本摘要等。数据集基于Project...
    packageimg
  • IMDB电影评论情感分析数据集-电影评论情感分类预测

    2025年4月21日   

    IMDB电影评论情感分析数据集-电影评论情感分类预测 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本分类,机器学习,IMDB,情感,评论,文本数据 数据概述:...
    packageimg
  • SuperGLUE自然语言理解任务基准数据集

    2025年4月20日   

    SuperGLUE自然语言理解任务基准数据集 数据来源:互联网公开数据 标签:自然语言处理, NLP, 语言理解, 文本分类, 问答, 语义推理, 多任务学习 数据概述: SuperGLUE 是一个由多个具有挑战性的自然语言理解(NLU)任务组成的数据集,旨在评估模型的泛化能力和对复杂语言现象的理解程度。该基准测试是 GLUE(General...
    packageimg
  • 序列分类数据集

    2025年4月20日   

    序列分类数据集 数据来源:互联网公开数据 标签:序列分类,多分类任务,文本分类,自然语言处理,机器学习,小语言模型,数据标注,分类模型,分类任务 数据概述:...
    packageimg
  • 科幻与奇幻主题标签分类数据集

    2025年4月20日   

    科幻与奇幻主题标签分类数据集 数据来源:互联网公开数据 标签:科幻, 幻想, 标签分类, 多标签分类, 数据挖掘, 文本分类, 主题分析 数据概述...
    packageimg