找到3,935个数据集

标签: 文本分类

过滤结果
  • 泰米尔语新闻数据集

    2025年4月15日   

    泰米尔语新闻数据集 数据来源:互联网公开数据 标签:泰米尔语,新闻,文本分类,数据集,印度语言,自然语言处理,基准测试 数据概述:...
    packageimg
  • 印度网络言论仇恨言论分类数据集2023

    2025年4月15日   

    印度网络言论仇恨言论分类数据集2023 数据来源:互联网公开数据 标签:仇恨言论,网络言论,文本分类,机器学习,算法模型,社交媒体分析,内容审查 数据概述:...
    packageimg
  • 新闻组文章分类数据集1990-2000

    2025年4月15日   

    新闻组文章分类数据集1990-2000 数据来源:互联网公开数据 标签:新闻组,文本分类,文本预处理,文本聚类,主题挖掘,主题分类,自然语言处理 数据概述:...
    packageimg
  • 查询意图领域分类数据集

    2025年4月15日   

    查询意图领域分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,查询意图,领域分类,搜索引擎,NLP,机器学习 数据概述:...
    packageimg
  • 网络欺凌毒性文本分类数据集

    2025年4月15日   

    网络欺凌毒性文本分类数据集 数据来源:互联网公开数据 标签:网络欺凌,毒性文本,文本分类,自然语言处理,情感分析,内容安全,数据集 数据概述:...
    packageimg
  • 印度泰米尔-英语文本情感分析数据集2021

    2025年4月15日   

    印度泰米尔-英语文本情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,泰米尔语,英语,多语言处理,社交媒体评论,文本分类,自然语言处理 数据概述: 本数据集包含从YouTube视频评论中收集的15,744条泰米尔-...
    packageimg
  • 灾害推文分类训练数据集

    2025年4月15日   

    灾害推文分类训练数据集 数据来源:互联网公开数据 标签:灾害推文,自然灾害,文本分类,机器学习,训练数据 数据概述: 本数据集是用于自然语言处理(NLP)的灾害推文分类任务的更新版训练集,包含了一些简短的推文,并且已经进行了填充处理。数据集中的每条推文都标注了是否与灾害相关,适用于训练灾害推文分类模型。 数据用途概述:...
    packageimg
  • 维基百科多语言文本识别数据集-2018

    2025年4月15日   

    维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。...
    packageimg
  • 可疑微博数据集

    2025年4月15日   

    可疑微博数据集 数据来源:互联网公开数据 标签:社交媒体,文本分类,异常检测,网络安全,内容监管,自然语言处理,情感分析 数据概述 本数据集包含一批经过分类的社交媒体文本数据,主要用于识别和分析可疑内容。数据中的每条记录代表一条微博文本,并根据其是否具有可疑特征被标注为“可疑”或“非可疑”。具体标注规则如下: - 可疑 = 1 - 非可疑 = 0...
    packageimg
  • 社交媒体虚假声明检测与分类声明数据集

    2025年4月15日   

    社交媒体虚假声明检测与分类声明数据集 数据来源:互联网公开数据 标签:虚假声明检测,社交媒体,文本分类,深度学习,信息真实性,声明分析,自然语言处理 数据概述: 本数据集旨在解决社交媒体平台上虚假信息和假新闻的传播问题,通过收集和整理声明文本及其相关元数据,构建了一个用于检测虚假声明的结构化数据集。数据集包含以下字段: - ID:唯一标识符 -...
    packageimg
  • 尼泊尔语文本情感分析数据集

    2025年4月15日   

    尼泊尔语文本情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,文本分类,自然语言处理,语言学,情感标签 数据概述: 本数据集包含了尼泊尔语的句子,并附带了情感标签。数据集旨在用于尼泊尔语文本的情感分析任务。每个句子都对应一个情感标签,用于区分句子的情感倾向。 情感标签定义如下: 1:正面情感 0:负面情感 2:中性情感 数据用途概述:...
    packageimg
  • 自杀倾向文本分析数据集

    2025年4月15日   

    自杀倾向文本分析数据集 数据来源:互联网公开数据 标签:自杀倾向,社交媒体,自然语言处理,情感分析,心理健康,文本分类,Reddit,数据清洗 数据概述:...
    packageimg
  • 大英百科全书文章标题数据集

    2025年4月15日   

    大英百科全书文章标题数据集 数据来源:互联网公开数据 标签:大英百科全书,文章标题,科技,艺术,文本分类,NLP,文本分析 数据概述: 本数据集收录了大英百科全书中的“艺术与科技”类目下的文章标题,通过大英百科全书API创建。未来版本将增加其他文章类别。数据集为进行文本分类、自然语言处理(NLP)任务和文本分析提供了丰富的标题样本。 数据用途概述:...
    packageimg
  • 推特文本情感分析-种族歧视与非歧视推文分类数据集

    2025年4月15日   

    推特文本情感分析-种族歧视与非歧视推文分类数据集 数据来源:互联网公开数据 标签:推特,文本分析,情感分析,种族歧视,自然语言处理,社交媒体,文本分类,机器学习 数据概述: 本数据集包含推特推文数据,用于种族歧视与非种族歧视言论的分类研究。...
    packageimg
  • 土耳其钓鱼邮件数据集

    2025年4月15日   

    土耳其钓鱼邮件数据集 数据来源:互联网公开数据 标签:钓鱼邮件,合法邮件,土耳其,网络安全,机器学习,文本分类,自然语言处理,社会工程学 数据概述: 本数据集包含7,500多封土耳其的钓鱼邮件和合法邮件,是进行钓鱼检测、网络安全研究和自然语言处理研究的宝贵资源。数据集包含邮件的唯一标识符、主题、发件人地址、邮件内容和类别等信息,覆盖了广泛的邮件样本。...
    packageimg
  • 诗歌情感分析数据集

    2025年4月15日   

    诗歌情感分析数据集 数据来源:互联网公开数据 标签:诗歌,情感分析,文学研究,机器学习,自然语言处理,文本分类 数据概述:...
    packageimg
  • 德古拉与傲慢与偏见文本分类数据集

    2025年4月15日   

    德古拉与傲慢与偏见文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,文学作品,情感分析,语料库,句子级别 数据概述: 本数据集包含《德古拉》(Dracula)和《傲慢与偏见》(Pride and...
    packageimg
  • HP打印机客户评论数据集

    2025年4月15日   

    HP打印机客户评论数据集 数据来源:互联网公开数据 标签:HP打印机,客户评论,文本分类,情感分析,市场研究,产品改进,消费者反馈 数据概述: 本数据集包含HP打印机的客户评论及其相关属性,数据来源于多个渠道,涵盖了客户评论的文本内容以及其它相关信息。该数据集适用于文本分类和情感分析任务,为机器学习模型的训练和评估提供了坚实的基础。 数据用途概述:...
    packageimg
  • 越南餐饮评论情感分析数据集1963-2021

    2025年4月15日   

    越南餐饮评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:越南,餐饮评论,情感分析,机器学习,自然语言处理,文本分类,特征提取,推荐系统,跨语言分析 数据概述: 本数据集是两个现有数据集的整合和精选集合,即Taaaan和Vu Duc Thinh编写的《越南情感分析-Foody》以及Cฦฐฦกง Khuแบฅต...
    packageimg
  • 推特情感数据集

    2025年4月15日   

    推特情感数据集 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,用户意见,自然语言处理,文本分类,公众情绪 数据概述: 本数据集包含推特用户对某一话题或事件的意见表达,每条推文都经过标注,反映了用户的情感倾向(正面、负面或中性)。数据集旨在为情感分析研究提供样本数据,涵盖多样化的用户观点和情感表达。 数据用途概述:...
    packageimg