找到3,840个数据集

标签: 文本分类

过滤结果
  • 尼泊尔新闻文章文本分类与摘要数据集

    2025年4月15日   

    尼泊尔新闻文章文本分类与摘要数据集 数据来源:互联网公开数据 标签:尼泊尔语,新闻文章,文本分类,文本摘要,自然语言处理,NLP,机器学习,文本数据 数据概述: 本数据集包含约7500篇尼泊尔语新闻文章,来源于多个尼泊尔新闻网站。数据集经过清洗,包含相对平衡的训练集和测试集,适用于训练和评估尼泊尔语文本分类模型和文本摘要模型。 数据用途概述:...
    packageimg
  • 反垃圾邮件分类检测邮件数据集

    2025年4月15日   

    反垃圾邮件分类检测邮件数据集 数据来源:互联网公开数据 标签:反垃圾邮件,邮件分类,机器学习,数据集,Spam,Ham,文本分类,自然语言处理 数据概述:...
    packageimg
  • IMDB5000电影数据集

    2025年4月15日   

    IMDB5000电影数据集 数据来源:互联网公开数据 标签:电影评分,电影类型,电影描述,数据分析,文本分类,电影推荐,内容理解 数据概述: 本数据集包含了 9714 部电影的评分和类型信息,数据于 2020 年 5 月 13 日创建。数据集中每个电影条目包含两个主要字段: - desc:电影的简要描述,用于概括电影内容或主题。 -...
    packageimg
  • 迪拜帆船酒店评论数据集

    2025年4月15日   

    迪拜帆船酒店评论数据集 数据来源:互联网公开数据 标签:帆船酒店,迪拜,旅游评论,情感分析,主题建模,文本分类,趋势分析,推荐系统 数据概述: 本数据集包含4720条关于迪拜帆船酒店(Jumeirah Burj Al...
    packageimg
  • 讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集

    2025年4月15日   

    讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集 数据来源:互联网公开数据 标签:讽刺,情感分析,文本分类,自然语言处理,语料库,机器学习,社交媒体,语言学 数据概述:...
    packageimg
  • 流行语录作者分类数据集

    2025年4月15日   

    流行语录作者分类数据集 数据来源:互联网公开数据 标签:流行语录,作者分类,文本分类,自然语言处理,机器学习,数据科学 数据概述: 本数据集包含世界知名作家所写的流行语录,涵盖多个著名作家的作品。数据集由两列组成,第一列是作家撰写的语录,第二列是相应作家的姓名。该数据集适用于二元文本分类任务,旨在根据语录内容识别作者。 数据用途概述:...
    packageimg
  • 孟加拉语文本分类研究数据集

    2025年4月15日   

    孟加拉语文本分类研究数据集 数据来源:互联网公开数据 标签:孟加拉语,情感分析,毒性评论,文本分类,自然语言处理,多标签分类,社会媒体内容 数据概述:...
    packageimg
  • 土耳其新闻标题点击诱饵分类数据集

    2025年4月15日   

    土耳其新闻标题点击诱饵分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 数据分类, 文本分析, 媒体研究, 数据标注, 文本分类 数据概述:...
    packageimg
  • 点击诱饵新闻标题分类数据集

    2025年4月14日   

    点击诱饵新闻标题分类数据集 数据来源:互联网公开数据 标签:新闻标题, 点击诱饵, 文本分类, 机器学习, 数据标注, 社交媒体, 新闻分析 数据概述: 本数据集包含新闻标题的分类数据,主要分为“点击诱饵”(clickbait)和“非点击诱饵”(non-...
    packageimg
  • 情感分析文本情感分类数据集

    2025年4月14日   

    情感分析文本情感分类数据集 数据来源:互联网公开数据 标签:情感分析,文本分类,自然语言处理,机器学习,情感识别,文本数据 数据概述: 本数据集是一个用于情感分析的文本情感分类数据集。 数据集包含文本内容及其对应的情感标签,用于训练和评估情感分析模型。...
    packageimg
  • 作者身份识别推文数据集

    2025年4月14日   

    作者身份识别推文数据集 数据来源:互联网公开数据 标签:文本数据,推文,作者身份,作者归属,自然语言处理,机器学习,文本分类,社交媒体分析 数据概述: 本数据集包含了推文内容及其对应的作者姓名,旨在为构建作者身份识别模型提供基准数据集。 数据集包含不同作者发布的推文文本,可用于训练模型来识别推文的作者。 数据用途概述:...
    packageimg
  • 在线搜索查询意图领域分类数据集

    2025年4月14日   

    在线搜索查询意图领域分类数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,搜索,查询,意图识别,机器学习,在线搜索,数据挖掘 数据概述: 本数据集由Analytics...
    packageimg
  • 英语-西班牙语和葡萄牙语语言变体数据集

    2025年4月14日   

    英语-西班牙语和葡萄牙语语言变体数据集 数据来源:互联网公开数据 标签:语言变体,葡萄牙语,西班牙语,英语,地理分布,语言差异,文本分类,社会语言学 数据概述:...
    packageimg
  • 社交媒体内容情感分析与OCR文本数据集2023

    2025年4月14日   

    社交媒体内容情感分析与OCR文本数据集2023 数据来源:互联网公开数据 标签:社交媒体,情感分析,OCR,文本分类,图像处理,自然语言处理 数据概述:...
    packageimg
  • 波斯语情绪分析与分类数据集

    2025年4月14日   

    波斯语情绪分析与分类数据集 数据来源:互联网公开数据 标签:情绪分析,波斯语,文本分类,自然语言处理,情感识别,机器学习 数据概述:...
    packageimg
  • 英国冠状病毒新闻文章数据集

    2025年4月14日   

    英国冠状病毒新闻文章数据集 数据来源:互联网公开数据 标签:冠状病毒,英国新闻,数据抓取,文本分类,新闻媒体,疫情报道,机器学习 数据概述:...
    packageimg
  • 旁遮普邦巴基斯坦车牌字体数据集

    2025年4月14日   

    旁遮普邦巴基斯坦车牌字体数据集 数据来源:互联网公开数据 标签:车牌识别,字符识别,光学字符识别,机器学习,深度学习,印度,旁遮普邦,车牌字体,文本分类 数据概述: 本数据集包含用于文本识别任务的0-9和a-...
    packageimg
  • 垃圾邮件过滤研究-SpamAssassin邮件数据集

    2025年4月14日   

    垃圾邮件过滤研究-SpamAssassin邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,SpamAssassin,邮件,文本分类,自然语言处理,机器学习,贝叶斯,语料库 数据概述:...
    packageimg
  • 阿拉伯语方言数据集

    2025年4月14日   

    阿拉伯语方言数据集 数据来源:互联网公开数据 标签:阿拉伯语方言,社交媒体文本,文本分类,语言分析,自然语言处理,区域语言差异 数据概述: 本数据集来源于Twitter平台,包含38,394条记录,主要分为四类阿拉伯语方言,分别为埃及方言、海湾方言、约旦方言和也门方言。各类别数据分布不均衡,为研究人员提供了多样化的数据资源。 数据用途概述:...
    packageimg
  • 印地语混合语YouTube评论仇恨言论NLP使用数据集

    2025年4月14日   

    印地语混合语YouTube评论仇恨言论NLP使用数据集 数据来源:互联网公开数据 数据集说明: 本数据集旨在支持对社交媒体中针对宗教的仇恨言论进行自动识别与分析,特别聚焦于 Hindi-English code-mixed(印地语-英语混合)语言 的 YouTube...
    packageimg