找到3,840个数据集

标签: 文本分类

过滤结果
  • 土耳其语文本分类预处理数据集

    2025年4月15日   

    土耳其语文本分类预处理数据集 数据来源:互联网公开数据 标签:文本分类,土耳其语,预处理,机器学习,自然语言处理,文本挖掘 数据概述:...
    packageimg
  • 社交媒体Twitter巴西葡萄牙语情感分析数据集

    2025年4月15日   

    社交媒体Twitter巴西葡萄牙语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,葡萄牙语,巴西,社交媒体文本,自然语言处理,文本分类,情绪识别 数据概述 本数据集为 Caramelo-Smile-V3 模型的情感分析训练数据,完全基于巴西葡萄牙语(PT-BR)。数据集构建自 Twitter...
    packageimg
  • 洋葱网讽刺新闻媒体内容数据集当前

    2025年4月15日   

    洋葱网讽刺新闻媒体内容数据集当前 数据来源:互联网公开数据 标签:讽刺新闻,洋葱网,媒体内容,自然语言处理,文本分类,数据分析 数据概述: 本数据集收录了洋葱网(The Onion)发布的讽刺新闻内容,包括新闻标题、发布时间及详细内容。数据集涵盖当前时间段内的新闻内容,展示了洋葱网独特的讽刺风格和媒体内容创作特点。 数据用途概述:...
    packageimg
  • Reddit宗教文本分类数据集

    2025年4月15日   

    Reddit宗教文本分类数据集 数据来源:互联网公开数据 标签:Reddit, 宗教, 文本分类, 自然语言处理, 社交媒体, 文本数据, 宗教信仰 数据概述:...
    packageimg
  • 顶级15款手机应用用户反馈数据集

    2025年4月15日   

    顶级15款手机应用用户反馈数据集 数据来源:互联网公开数据 标签:用户反馈,手机应用,自然语言处理,文本分类,主题建模,用户情感,用户偏好,趋势分析 数据概述:...
    packageimg
  • 孟加拉语-英语-印地语混合语言侮辱性语言识别数据集

    2025年4月15日   

    孟加拉语-英语-印地语混合语言侮辱性语言识别数据集 数据来源:互联网公开数据 标签:侮辱性语言,代码混合,孟加拉语,英语,印地语,自然语言处理,文本分类,情感分析 数据概述:...
    packageimg
  • 烂番茄电影评论情感分析数据集1963-2021

    2025年4月15日   

    烂番茄电影评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,文本分类 数据概述: 本数据集包含了来自烂番茄网站的5,331条正面和5,331条负面电影评论,总计10,662条评论记录。每条评论均已被处理,数据集中包含评论文本和对应的情感标签(正面或负面)。该数据集最初由Bo...
    packageimg
  • 分类推文数据集

    2025年4月15日   

    分类推文数据集 数据来源:互联网公开数据 标签:社交媒体,情感分析,网络安全,仇恨言论,网络欺凌,自杀倾向,机器学习,文本分类 数据概述 本数据集由原始的“可疑推文”数据集经过进一步精细化处理而成,旨在更详细地对推文进行分类。数据集中包含了推文文本及其分类标签,推文内容被分为“可疑”或“非可疑”。对于标记为“可疑”的推文,进一步细分为以下子类别: -...
    packageimg
  • Eminem专辑YouTube评论垃圾邮件分类数据集

    2025年4月15日   

    Eminem专辑YouTube评论垃圾邮件分类数据集 数据来源:互联网公开数据 标签:Eminem, YouTube, 评论, 垃圾邮件, 自然语言处理, 机器学习, 文本分类, 社交媒体分析 数据概述: 本数据集由Ezhil...
    packageimg
  • 恐慌与忧虑情感语料库

    2025年4月15日   

    恐慌与忧虑情感语料库 数据来源:互联网公开数据 标签:情感分析,多语言,panic,worry,文本分类,情绪识别,跨语言研究 数据概述:...
    packageimg
  • 推特语言行为数据集

    2025年4月15日   

    推特语言行为数据集 数据来源:互联网公开数据 标签:推特,语言行为,沟通分析,文本分类,社交网络分析,自然语言处理,社交媒体研究 数据概述:...
    packageimg
  • 多语言大型语言模型生成文本数据集1963-2021

    2025年4月15日   

    多语言大型语言模型生成文本数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,多语言,文本生成,机器学习,自然语言处理,人工智能,深度学习,神经网络,数据科学,文本分类,语言理解,文本挖掘 数据概述:...
    packageimg
  • 尼泊尔语社交媒体情感分析数据集

    2025年4月15日   

    尼泊尔语社交媒体情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,尼泊尔语,社交媒体,文本分类,情感,NLP,机器学习 数据概述: 本数据集包含尼泊尔语社交媒体文本,并标注了情感极性。情感标签分为三类:积极(1),消极(0),和中性(2)。数据集来源于Hugging Face Datasets...
    packageimg
  • 社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开

    2025年4月15日   

    社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开 数据来源:互联网公开数据 标签:情感分析,自然语言处理,社交媒体,用户评论,文本分类,机器学习,情感分类,正负中性 数据概述: 本数据集旨在支持社交媒体情感分析任务,涵盖了用户评论的情感倾向分类。数据集包含训练集、开发集和测试集,用于模型的训练、验证和评估。...
    packageimg
  • 全球多语言垃圾短信检测数据集1963-2021

    2025年4月15日   

    全球多语言垃圾短信检测数据集1963-2021 数据来源:互联网公开数据 标签:垃圾短信检测,多语言NLP,文本分类,跨语言分析,文本数据 数据概述:...
    packageimg
  • 垃圾邮件分类文本数据集

    2025年4月15日   

    垃圾邮件分类文本数据集 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,二元分类,机器学习,数据标注,自然语言处理 数据概述:...
    packageimg
  • 自然语言处理数据增强用反向翻译数据集

    2025年4月15日   

    自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear...
    packageimg
  • 虚假新闻内容检测数据集

    2025年4月15日   

    虚假新闻内容检测数据集 数据来源:互联网公开数据 标签:虚假新闻,自然语言处理,NLP,内容检测,文本分类,社交媒体,新闻平台,机器学习 数据概述...
    packageimg
  • 孟加拉语仇恨言论检测数据集

    2025年4月15日   

    孟加拉语仇恨言论检测数据集 数据来源:互联网公开数据 标签:仇恨言论检测,孟加拉语,社交媒体分析,文本分类,自然语言处理,机器学习,语言资源 数据概述: 本数据集(BD-...
    packageimg
  • 多标签文本分类数据集

    2025年4月15日   

    多标签文本分类数据集 数据来源:互联网公开数据 标签:多标签分类,文本分类,信息学,学术论文,机器学习,标签预测,自然语言处理 数据概述...
    packageimg