找到3,840个数据集

标签: 文本分类

过滤结果
  • 电影评论情感分析数据集IMDBMoviesReviewDatasetforSentimentAnalysis-muhammadumairab

    2025年4月24日   

    电影评论情感分析数据集IMDBMoviesReviewDatasetforSentimentAnalysis-muhammadumairab 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电影评论,深度学习,人工智能...
    packageimg
  • 假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn

    2025年4月24日   

    假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn 数据来源:互联网公开数据 标签:假新闻,新闻,文本分析,自然语言处理,机器学习,情感分析,信息检索,文本分类 数据概述: 该数据集来自假新闻挑战赛(Fake News Challenge,FNC-1),旨在促进假新闻的自动检测和识别。主要特征如下:...
    packageimg
  • 推文训练数据集Tweets-TrainDataset-priyankacheruku

    2025年4月24日   

    推文训练数据集Tweets-TrainDataset-priyankacheruku 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的文本内容和相关情感标签。主要特征如下:...
    packageimg
  • 孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse

    2025年4月24日   

    孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,孟加拉语,文本分类,机器学习,情感识别,文本挖掘 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务,旨在识别和分类文本中的情感倾向。主要特征如下:...
    packageimg
  • 文本分类2022数据集DF-Classify2022-huynhtruc109

    2025年4月24日   

    文本分类2022数据集DF-Classify2022-huynhtruc109 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,深度学习,文本分析,人工智能,数据科学 数据概述: 该数据集包含来自2022年的文本分类数据,记录了不同类别文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2022年。...
    packageimg
  • 语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey

    2025年4月24日   

    语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey 数据来源:互联网公开数据 标签:语言检测,文本分析,数据集,自然语言处理,机器学习,多语言识别,文本分类,人工智能 数据概述: 该数据集包含来自不同来源的文本数据,记录了多种语言的文本样本,适用于语言检测和识别任务。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-wbq030607

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-wbq030607 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,文本分类,机器学习,信息传播,媒体研究,自然语言处理 数据概述: 该数据集包含来自互联网公开渠道的虚假新闻数据,记录了新闻标题,内容,发布时间,来源等信息。主要特征如下:...
    packageimg
  • 意图分类数据集IntentClassifierDataset-interviewturabit

    2025年4月24日   

    意图分类数据集IntentClassifierDataset-interviewturabit 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,人工智能,对话系统,语义理解 数据概述: 该数据集包含用于意图分类任务的文本数据,旨在训练和评估文本分类模型,以识别用户输入文本的意图。主要特征如下:...
    packageimg
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 简化虚假新闻数据集

    2025年4月24日   

    简化虚假新闻数据集 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,二分类问题,数据清洗,特征提取,新闻真实性分析 数据概述: 本数据集是虚假新闻与真实新闻数据集的简化版本,旨在为文本分类任务提供训练集。数据集已标注,包含真实新闻与虚假新闻的文本内容,适合作为自然语言处理(NLP)任务的基础数据。数据集经过初步处理,确保数据质量与一致性。...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran 数据来源:互联网公开数据 标签:新闻,虚假信息,自然语言处理,文本分类,机器学习,情感分析,社交媒体,信息安全 数据概述: 该数据集包含经过预处理并使用GloVe词嵌入的虚假新闻检测数据,记录了新闻文章的文本内容及其真实性标签。主要特征如下:...
    packageimg
  • 孟加拉语仇恨言论与俚语数据集-arkabhattachajee01

    2025年4月24日   

    孟加拉语仇恨言论与俚语数据集-arkabhattachajee01 数据来源:互联网公开数据 标签:仇恨言论,俚语,孟加拉语,自然语言处理,文本分类,情感分析,社交媒体,语言学 数据概述: 该数据集包含了孟加拉语社交媒体上的仇恨言论,其中部分言论使用了俚语。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常反映了社交媒体上的近期言论。...
    packageimg
  • 英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608

    2025年4月24日   

    英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,机器学习,文本分类,信息检索,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本,涵盖多个新闻类别。主要特征如下:...
    packageimg
  • 合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701

    2025年4月24日   

    合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701 数据来源:互联网公开数据 标签:法律文本,合同分析,数据集,自然语言处理,机器学习,法律研究,文本分类,智能合约 数据概述: 该数据集包含来自 CUAD(Contract Understanding...
    packageimg
  • 多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike

    2025年4月24日   

    多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,情感分析,机器学习,文本分类,情感识别,语言处理 数据概述:...
    packageimg
  • 情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98

    2025年4月24日   

    情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,情感分析,机器学习,自然语言处理,文本分类,情感不平衡,多类别分类 数据概述: 该数据集是用于情绪识别任务的文本数据集,重点关注情感类别的不平衡问题。主要特征如下: 时间跨度:...
    packageimg
  • 政治虚假新闻检测数据集2017

    2025年4月24日   

    政治虚假新闻检测数据集2017 数据来源:互联网公开数据 标签:虚假新闻,政治,文本分类,机器学习,n-gram分析,数据预处理,意见 spam 数据概述: 本数据集整合了“liar liar pants on...
    packageimg
  • 社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel

    2025年4月24日   

    社交媒体种族歧视言论数据集RacistCommentsDataset-gilchristmiguel 数据来源:互联网公开数据 标签:种族歧视,言论分析,自然语言处理,数据集,文本分类,情感分析,社交媒体,人工智能 数据概述: 该数据集包含来自社交媒体平台的种族歧视言论数据,旨在用于研究和分析种族歧视言论的识别与处理。主要特征如下:...
    packageimg
  • 自然语言处理作业三测试数据集-hangman1998

    2025年4月24日   

    自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。...
    packageimg
  • 推文情感分析数据集TweetSentimentAnalysisDataset-itoeiji

    2025年4月24日   

    推文情感分析数据集TweetSentimentAnalysisDataset-itoeiji 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,机器学习,自然语言处理,文本分类,数据挖掘,人工智能 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的内容及其情感倾向。主要特征如下:...
    packageimg