找到3,841个数据集

标签: 文本分类

过滤结果
  • 有害言论检测数据集ToxicSemEvalData-izuna385

    2025年4月26日   

    有害言论检测数据集ToxicSemEvalData-izuna385 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器学习,有害内容检测,社交媒体,文本分析 数据概述: 该数据集包含来自 SemEval 2017 竞赛的数据,主要用于有害言论的检测与分类。主要特征如下: 时间跨度:数据记录的时间范围为 SemEval...
    packageimg
  • 虚假新闻检测数据集FakeNewsCCDataset-rahilmerchant

    2025年4月26日   

    虚假新闻检测数据集FakeNewsCCDataset-rahilmerchant 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息,自然语言处理,机器学习,文本分类,信息传播,网络安全 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了新闻的真实性分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2019年。...
    packageimg
  • 对话意图分类数据集-anandnakat

    2025年4月26日   

    对话意图分类数据集-anandnakat 数据来源:互联网公开数据 标签:自然语言处理,对话系统,意图识别,数据集,机器学习,文本分类,人工智能,对话分析 数据概述: 该数据集包含用于对话意图分类的文本数据,记录了用户在对话中的各种表达方式及其对应的意图类别。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。...
    packageimg
  • 宗派语言与普通语言对比数据集

    2025年4月26日   

    宗派语言与普通语言对比数据集 数据来源:互联网公开数据 标签:宗派语言,普通语言,文本分类,自然语言处理,宗教文本,情感分析,社会研究 数据概述 本数据集包含两部分内容:宗派语言部分和普通语言部分。 宗派语言部分:收集了来自多个宗派领袖的演讲、会议记录和书面作品,包括但不限于《天命之书》(由Abdrushin撰写)、天堂之门(Heaven’s...
    packageimg
  • 六种情绪识别数据集-rahulshelke98

    2025年4月26日   

    六种情绪识别数据集-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,情感分析,数据集,机器学习,自然语言处理,文本分类,语音识别,人工智能 数据概述: 该数据集包含多种文本和语音数据,用于训练和评估情绪识别模型,涵盖了六种基本情绪。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的情绪表达。...
    packageimg
  • 灾难推文自然语言处理数据集NLPDisasterTweetsDataset-dnyaneshwalwadkar

    2025年4月26日   

    灾难推文自然语言处理数据集NLPDisasterTweetsDataset-dnyaneshwalwadkar 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本分类,机器学习,情感分析,推特,危机管理 数据概述:...
    packageimg
  • UIT问答数据集UITQADataset-callmelee117

    2025年4月26日   

    UIT问答数据集UITQADataset-callmelee117 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,文本分类,机器学习,智能对话,语言模型,人工智能 数据概述: 该数据集来自UIT问答系统项目,记录了用户提出的问题和对应的答案,适用于问答系统开发,文本分类和智能对话研究。主要特征如下:...
    packageimg
  • YouTube垃圾评论预处理数据集YouTubeSpamCommentPre-processedDataset-mdmhnayeem

    2025年4月26日   

    YouTube垃圾评论预处理数据集YouTubeSpamCommentPre-processedDataset-mdmhnayeem 数据来源:互联网公开数据 标签:社交媒体,垃圾评论,数据集,文本分类,机器学习,自然语言处理,内容审核,数据挖掘 数据概述:...
    packageimg
  • 文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro

    2025年4月26日   

    文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,深度学习,预训练模型,语言模型,模型微调 数据概述:...
    packageimg
  • 自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija

    2025年4月26日   

    自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,文本挖掘,人工智能 数据概述: 该数据集包含来自各类博客平台的文章数据,记录了不同主题和内容的博客文章信息。主要特征如下:...
    packageimg
  • Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17

    2025年4月26日   

    Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述:...
    packageimg
  • 情感分析平衡数据集6-EmotionBalancedData-rahulshelke98

    2025年4月26日   

    情感分析平衡数据集6-EmotionBalancedData-rahulshelke98 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,心理学,数据平衡,情感识别 数据概述: 该数据集包含来自社交媒体,评论网站等公开渠道的文本数据,记录了包含六种基本情感(喜怒哀乐惊恐)的文本片段。主要特征如下:...
    packageimg
  • 意图识别数据集IntentRecognitionDataset-himanshunayal

    2025年4月26日   

    意图识别数据集IntentRecognitionDataset-himanshunayal 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,对话系统,情感分析,语义理解,人工智能 数据概述: 该数据集包含了用于意图识别任务的文本数据,旨在训练和评估自然语言处理模型对用户输入的意图进行准确分类。主要特征如下:...
    packageimg
  • YouTube评论垃圾信息分类数据集YouTubeSpamCollectionDataset-hinxcode

    2025年4月26日   

    YouTube评论垃圾信息分类数据集YouTubeSpamCollectionDataset-hinxcode 数据来源:互联网公开数据 标签:垃圾信息识别,数据集,机器学习,自然语言处理,评论分析,社交媒体,文本分类,内容审核 数据概述:...
    packageimg
  • 无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147

    2025年4月26日   

    无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147 数据来源:互联网公开数据 标签:主题分析,数据集,文本挖掘,自然语言处理,文本分类,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自公开互联网资源的文本数据,记录了不使用TF-IDF方法进行主题分析的文本样本。主要特征如下:...
    packageimg
  • 高棉语文本数据集KhmerTextDataset123-layacheadeth

    2025年4月26日   

    高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源:互联网公开数据 标签:自然语言处理,文本分析,高棉语,机器学习,语言模型,数据集,多语言处理,文本分类 数据概述: 该数据集包含来自互联网的高棉语文本数据,记录了高棉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。...
    packageimg
  • 语言分类数据集LanguageClassificationDataset-jhaamanvaibhav

    2025年4月26日   

    语言分类数据集LanguageClassificationDataset-jhaamanvaibhav 数据来源:互联网公开数据 标签:语言分类,自然语言处理,数据集,机器学习,文本分析,多语言,数据挖掘,文本分类 数据概述: 该数据集包含来自多个来源的语言分类数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:...
    packageimg
  • 超级短信数据集SuperSMSDataset-jayaprakashpondy

    2025年4月26日   

    超级短信数据集SuperSMSDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:短信分析,数据集,文本分类,自然语言处理,机器学习,通信技术,信息安全,数据挖掘 数据概述: 该数据集包含来自公开渠道的短信数据,记录了各类短信的文本内容和分类标签。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf

    2025年4月26日   

    人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf 数据来源:互联网公开数据 标签:自然语言处理,机器学习,文本分类,人工智能检测,深度学习,数据集,文本分析,文本生成 数据概述:...
    packageimg
  • 数据2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz

    2025年4月26日   

    2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz 数据来源:互联网公开数据 标签:事实核查,数据集,跨领域,机器学习,自然语言处理,文本分类,信息检索,可信度评估 数据概述: 该数据集源自2022年国际交叉语言评估会议(CLEF...
    packageimg