找到3,935个数据集

标签: 文本分类

过滤结果
  • 新闻真伪识别数据集-涵盖多种来源与真实新闻对比

    2025年4月18日   

    新闻真伪识别数据集-涵盖多种来源与真实新闻对比 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,真实新闻,文本分类,机器学习,自然语言处理,舆情分析 数据概述: 本数据集整合了来自不同来源的新闻文章,经过清洗和特征工程处理,用于新闻真伪识别研究。数据集包含新闻文本及其对应的标签,标签分为两类:0代表假新闻,1代表真实新闻。 数据用途概述:...
    packageimg
  • 自然语言处理新闻真伪识别数据集

    2025年4月18日   

    自然语言处理新闻真伪识别数据集 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 虚假新闻, 真实新闻, 新闻分析, 机器学习, 文本数据 数据概述: 本数据集包含用于新闻真伪识别的文本数据,主要用于自然语言处理(NLP)相关研究。...
    packageimg
  • GitHub问题预测挑战赛问题类型预测数据集

    2025年4月18日   

    GitHub问题预测挑战赛问题类型预测数据集 数据来源:互联网公开数据 标签:GitHub,问题预测,文本分类,自然语言处理,机器学习,代码缺陷,软件开发,NLP,BERT 数据概述:...
    packageimg
  • Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集

    2025年4月17日   

    Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集 数据来源:互联网公开数据 标签:邮件,Enron,垃圾邮件,非垃圾邮件,文本分类,自然语言处理,数据清洗,邮件分析 数据概述:...
    packageimg
  • AI文本检测数据预处理数据集

    2025年4月17日   

    AI文本检测数据预处理数据集 数据来源:互联网公开数据 标签:AI文本检测,自然语言处理,文本分类,数据预处理,机器学习,特征工程,文本清洗 数据概述: 本数据集是原始AI文本检测数据集的预处理版本,原始数据来源于Kaggle平台(https://www.kaggle.com/datasets/thedrcat/daigt-v2-train-...
    packageimg
  • 可再生能源事故检测数据集

    2025年4月16日   

    可再生能源事故检测数据集 数据来源:互联网公开数据 标签:可再生能源, 事故检测, 自然语言处理, 深度学习, 文本分类, 行业安全, 数据标注 数据概述:...
    packageimg
  • Kickstarter项目描述文本与项目成功状态数据集-2017年

    2025年4月16日   

    Kickstarter项目描述文本与项目成功状态数据集-2017年 数据来源:互联网公开数据 标签:众筹项目,Kickstarter,自然语言处理,项目成功预测,文本分析,机器学习,项目描述,文本分类 数据概述:...
    packageimg
  • 德语新闻文章主题分类数据集

    2025年4月16日   

    德语新闻文章主题分类数据集 数据来源:互联网公开数据 标签:德语,新闻,主题分类,多分类,语言模型,文本分类,研究数据集 数据概述:...
    packageimg
  • Jigsaw多语言恶意评论翻译测试数据集-多语言-英语

    2025年4月16日   

    Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述:...
    packageimg
  • 俄罗斯幽默笑话主题分类数据集

    2025年4月16日   

    俄罗斯幽默笑话主题分类数据集 数据来源:互联网公开数据 标签:笑话,俄罗斯,幽默,文本分类,自然语言处理,情感分析,语言文化,喜剧 数据概述: 本数据集包含大量俄罗斯幽默笑话的文本内容,旨在为文本分类任务提供训练和测试数据。数据集中的每个笑话都附带了文本信息,可用于预测笑话的主题或进行情感分析。 数据用途概述:...
    packageimg
  • 恶意评论分类数据集

    2025年4月15日   

    恶意评论分类数据集 数据来源:互联网公开数据 标签:恶意评论,网络仇恨,在线 abuse,文本分类,机器学习,社会媒体分析,数据挖掘 数据概述:...
    packageimg
  • 多语言毒性评论检测数据集

    2025年4月15日   

    多语言毒性评论检测数据集 数据来源:互联网公开数据 标签:毒性评论,多语言,自然语言处理,机器学习,文本分类,跨语言学习 数据概述:...
    packageimg
  • 垃圾文本分类数据集

    2025年4月15日   

    垃圾文本分类数据集 数据来源:互联网公开数据 标签:垃圾文本,文本分类,自然语言处理,市场调研,质量控制,机器学习 数据概述:...
    packageimg
  • 全球议题新闻分类数据集

    2025年4月15日   

    全球议题新闻分类数据集 数据来源:互联网公开数据 标签:新闻分类,全球议题,文本分类,多分类问题,不平衡数据,动态更新,机器学习基准数据集 数据概述...
    packageimg
  • 仇恨言论分类数据集

    2025年4月15日   

    仇恨言论分类数据集 数据来源:互联网公开数据 标签:仇恨言论,MeToo运动,社交媒体分析,文本分类,数据挖掘,社会研究,自然语言处理 数据概述:...
    packageimg
  • 中文情感评分数据集

    2025年4月15日   

    中文情感评分数据集 数据来源:互联网公开数据 标签:情感分析,中文文本,情感评分,自然语言处理,数据标注,文本分类 数据概述:...
    packageimg
  • 网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用

    2025年4月15日   

    网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用 数据来源:互联网公开数据 标签:网络安全,BERT,NLP,威胁检测,文本分类,恶意软件分析,漏洞,网络安全威胁,文本数据,机器学习 数据概述: Cyber-...
    packageimg
  • 全球金融新闻与股市关联性研究数据集2007-2023

    2025年4月15日   

    全球金融新闻与股市关联性研究数据集2007-2023 数据来源:互联网公开数据 标签:金融新闻,股市预测,情感分析,因果关系,文本分类,LSTM,金融市场研究 数据概述:...
    packageimg
  • 印度政治推文数据集

    2025年4月15日   

    印度政治推文数据集 数据来源:互联网公开数据 标签:印度政治,推文数据,情感分析,选举活动,文本分类,党派分析,社交媒体舆情 数据概述 本数据集包含与印度主要政党之一——印度人民党(Bharatiya Janata Party, BJP)相关的推文记录,涵盖了其在选举活动期间的公众舆论动态。数据集中的推文通过Twitter...
    packageimg
  • GPT检测器数据集

    2025年4月15日   

    GPT检测器数据集 数据来源:互联网公开数据 标签:GPT检测器,非母语英语,文本分类,机器学习,预测分析,数据包,R语言 数据概述:...
    packageimg