找到3,840个数据集

标签: 文本分类

过滤结果
  • 电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra

    2025年4月24日   

    电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据集,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自 UCI 机器学习数据库的电子邮件数据,用于垃圾邮件过滤研究。主要特征如下: 时间跨度:数据记录时间不明确,但可推断为收集于互联网早期。...
    packageimg
  • 深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh

    2025年4月24日   

    深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh 数据来源:互联网公开数据 标签:自然语言处理,深度学习,数据集,文本分析,机器学习,语言模型,文本分类,情感分析 数据概述:该数据集包含用于自然语言处理的深度学习模型训练和评估的数据,记录了多种文本类型和任务的数据。主要特征如下:...
    packageimg
  • 泰米尔语二分类推文数据集TamilBinaryClassification1kTweetsLabelsv1-kracekumar

    2025年4月24日   

    泰米尔语二分类推文数据集TamilBinaryClassification1kTweetsLabelsv1-kracekumar 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,数据集,情感分析,机器学习,文本分类,社交媒体,二分类 数据概述:...
    packageimg
  • 新冠疫情推文分类数据集COVID-19TweetClassificationDataset-makhloufsabir

    2025年4月24日   

    新冠疫情推文分类数据集COVID-19TweetClassificationDataset-makhloufsabir 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,机器学习,疫情研究,自然语言处理,公共卫生,情感分析 数据概述:...
    packageimg
  • 推特仇恨言论检测数据集TwitterHateSpeechDetectionDataset-trangnguyn95

    2025年4月24日   

    推特仇恨言论检测数据集TwitterHateSpeechDetectionDataset-trangnguyn95 数据来源:互联网公开数据 标签:推特,仇恨言论,数据集,文本分析,自然语言处理,机器学习,社交媒体,文本分类 数据概述:该数据集包含来自推特的文本数据,记录了用户发布的推文及其是否包含仇恨言论的信息。主要特征如下:...
    packageimg
  • IMDB电影评论情感分析数据集IMDBSmallDataset8000-MovieReviewSentimentAnalysisDataset-great23u5

    2025年4月24日   

    IMDB电影评论情感分析数据集IMDBSmallDataset8000-MovieReviewSentimentAnalysisDataset-great23u5 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,电影评论,机器学习,文本分类,深度学习,数据挖掘 数据概述:...
    packageimg
  • 零样本文本分类预测数据集-terrychanorg

    2025年4月24日   

    零样本文本分类预测数据集-terrychanorg 数据来源:互联网公开数据 标签:文本分类,零样本学习,自然语言处理,数据集,机器学习,深度学习,人工智能,NLP 数据概述: 该数据集包含用于零样本文本分类任务的文本数据和标签信息。主要特征如下: 时间跨度:数据更新时间不定,数据集内容持续更新。...
    packageimg
  • 旁遮普语情感分析数据集PunjabiEmotionData-sahib12

    2025年4月24日   

    旁遮普语情感分析数据集PunjabiEmotionData-sahib12 数据来源:互联网公开数据 标签:情感分析,自然语言处理,旁遮普语,数据集,文本分类,机器学习,语言学,印度文化 数据概述: 该数据集包含了旁遮普语的文本数据,标注了相应的情感标签,主要用于情感分析研究。主要特征如下: 时间跨度:...
    packageimg
  • 字符级别卷积神经网络权重数据集CharacterLevelCNNWeightsDataset-osciiart

    2025年4月24日   

    字符级别卷积神经网络权重数据集CharacterLevelCNNWeightsDataset-osciiart 数据来源:互联网公开数据 标签:字符级别CNN,权重数据,机器学习,深度学习,文本分类,自然语言处理,数据集,模型权重 数据概述: 该数据集包含字符级别卷积神经网络(Character Level...
    packageimg
  • 情感分析数据集SentimentalDataset-felixkiprotich

    2025年4月24日   

    情感分析数据集SentimentalDataset-felixkiprotich 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,情感识别,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同场景下的情感表达。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • Reddit社交媒体评论情感分类数据集

    2025年4月24日   

    Reddit社交媒体评论情感分类数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,社交媒体,情绪识别,文本分类,Reddit,机器学习 数据概述:...
    packageimg
  • 酒店评论情感分析数据集HotelCommentSentimentAnalysisDataset-hariwh0

    2025年4月24日   

    酒店评论情感分析数据集HotelCommentSentimentAnalysisDataset-hariwh0 数据来源:互联网公开数据 标签:情感分析,酒店评论,数据集,自然语言处理,机器学习,文本分类,客户关系,商业智能 数据概述: 该数据集包含来自各大酒店平台的用户评论数据,记录了酒店顾客的反馈和评价。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsChallengeDataset-quentinducoulombier

    2025年4月24日   

    虚假新闻检测数据集FakeNewsChallengeDataset-quentinducoulombier 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分类,信息传播,数据分析,新闻媒体 数据概述: 该数据集来自虚假新闻挑战赛(Fake News Challenge),记录了网络新闻文本及其真实性标签。主要特征如下:...
    packageimg
  • 讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef

    2025年4月24日   

    讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,情感识别,人工智能,语言模型 数据概述: 该数据集包含来自社交媒体,新闻评论和论坛等公开来源的文本数据,记录了用户生成内容中的讽刺表达。主要特征如下:...
    packageimg
  • 情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf

    2025年4月24日   

    情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,NLP,二分类,情感倾向 数据概述: 该数据集包含来自斯坦福情感树库(Stanford Sentiment Treebank, SST)的情感倾向分类数据,记录了句子的情感极性。主要特征如下:...
    packageimg
  • 垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab

    2025年4月24日   

    垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,数据集,机器学习,邮件过滤,文本分析,信息检索 数据概述:该数据集包含来自SpamAssassin项目的邮件数据,用于训练和测试垃圾邮件过滤系统。主要特征如下:...
    packageimg
  • 摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine

    2025年4月24日   

    摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,情感分析,机器学习,自然语言处理,情感研究,多语言处理 数据概述:该数据集包含来自摩洛哥社交媒体平台的推文数据,记录了用户发布的推文内容及情感倾向。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych 数据来源:互联网公开数据 标签:新闻分析,虚假新闻,数据集,文本分类,机器学习,自然语言处理,传播学,信息安全 数据概述: 该数据集包含来自互联网公开渠道的新闻文章数据,记录了真假新闻的特征和标签。主要特征如下:...
    packageimg
  • 多分类电子邮件数据集-amalverma27

    2025年4月24日   

    多分类电子邮件数据集-amalverma27 数据来源:互联网公开数据 标签:电子邮件,文本分类,垃圾邮件检测,自然语言处理,机器学习,数据集,邮件安全,信息检索 数据概述: 该数据集包含电子邮件数据,旨在用于文本分类和垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含历史邮件数据。...
    packageimg
  • 语言识别数据集LanguageDetectorDataset-meet07824

    2025年4月24日   

    语言识别数据集LanguageDetectorDataset-meet07824 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,人工智能,数据分析 数据概述: 该数据集包含来自公开来源的语言识别数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:...
    packageimg