找到3,840个数据集

标签: 文本分类

过滤结果
  • 多数据集情感分析数据集Ser-MultiDatasetforSentimentAnalysis-simonemarullo

    2025年4月24日   

    多数据集情感分析数据集Ser-MultiDatasetforSentimentAnalysis-simonemarullo 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,深度学习,文本分类,人工智能 数据概述:该数据集包含多个来源的情感分析数据,记录了不同领域的文本数据及其对应的情感标签。主要特征如下:...
    packageimg
  • 路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu

    2025年4月24日   

    路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,数据集,信息检索,语料库,文本分析 数据概述: 该数据集包含来自路透社的新闻报道,主要用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围主要集中在1987年。...
    packageimg
  • BERT机器学习项目数据集BERTMachineLearningProjectDataset-sohambalkothe01

    2025年4月24日   

    BERT机器学习项目数据集BERTMachineLearningProjectDataset-sohambalkothe01 数据来源:互联网公开数据 标签:自然语言处理,机器学习,BERT模型,文本分类,深度学习,数据集,语言模型,AI应用 数据概述:...
    packageimg
  • 英国广播公司新闻文章数据集BBCNewsArticleDataset-mohamedtarek111

    2025年4月24日   

    英国广播公司新闻文章数据集BBCNewsArticleDataset-mohamedtarek111 数据来源:互联网公开数据 标签:新闻文章,文本分析,自然语言处理,数据集,文本分类,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章数据,记录了BBC新闻网站上发布的各类新闻文章。主要特征如下:...
    packageimg
  • 葡萄牙语社交媒体有害评论数据集ComentáriosTóxicosPT-BRDataset-gedorneto

    2025年4月24日   

    葡萄牙语社交媒体有害评论数据集ComentáriosTóxicosPT-BRDataset-gedorneto 数据来源:互联网公开数据 标签:社交媒体,有害评论,数据集,自然语言处理,情感分析,文本分类,机器学习,数据挖掘 数据概述:...
    packageimg
  • 社交媒体灾难事件推文数据集DisasterTweetsPreparedDataset-phanttan

    2025年4月24日   

    社交媒体灾难事件推文数据集DisasterTweetsPreparedDataset-phanttan 数据来源:互联网公开数据 标签:灾难事件,推文,社交媒体,自然语言处理,文本分类,机器学习,舆情分析,风险管理 数据概述: 该数据集包含了来自社交媒体平台Twitter的推文数据,旨在用于灾难事件的识别和分析。主要特征如下:...
    packageimg
  • 新闻组体育话题数据集NewsgroupSportsTopicDataset-cosimaxie

    2025年4月24日   

    新闻组体育话题数据集NewsgroupSportsTopicDataset-cosimaxie 数据来源:互联网公开数据 标签:新闻组,体育话题,文本分析,自然语言处理,机器学习,数据集,分类算法,文本分类 数据概述: 该数据集包含来自新闻组的体育话题相关文本数据,记录了新闻组中关于体育赛事,运动员,球队等内容的讨论。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-saraeldeeb

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-saraeldeeb 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,文本分类,机器学习,信息传播,媒体研究,社会影响 数据概述: 该数据集包含来自多个新闻来源的文本数据,记录了真实新闻与虚假新闻的内容特征。主要特征如下:...
    packageimg
  • 电影评论情感分析测试数据集IMDbTestSentimentAnalysisDataset-victorvic

    2025年4月24日   

    电影评论情感分析测试数据集IMDbTestSentimentAnalysisDataset-victorvic 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本分类,机器学习,数据挖掘,人工智能 数据概述:...
    packageimg
  • 新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy

    2025年4月24日   

    新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本挖掘,信息检索,新闻组,数据科学 数据概述: 该数据集包含来自20个不同新闻组的文本数据,记录了从1993年到1994年的新闻文章。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集IMDbDTST-MovieReviewsSentimentAnalysisDataset-grokhi

    2025年4月24日   

    电影评论情感分析数据集IMDbDTST-MovieReviewsSentimentAnalysisDataset-grokhi 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本分类,机器学习,情感计算,数据挖掘 数据概述:...
    packageimg
  • disastertweetanalysisdataset灾难推文分析数据集-phanttan

    2025年4月24日   

    disastertweetanalysisdataset灾难推文分析数据集-phanttan 数据来源: 互联网公开数据 标签: 自然语言处理,社交媒体,灾难响应,数据集,机器学习,情感分析,文本分类,公共安全 数据概述: 该数据集包含来自社交媒体平台Twitter的推文数据,主要记录与灾难相关的推文内容。主要特征如下: 时间跨度:...
    packageimg
  • 法律文档训练数据集TrainDataLegalDocDataset-lthnhtinostic

    2025年4月24日   

    法律文档训练数据集TrainDataLegalDocDataset-lthnhtinostic 数据来源:互联网公开数据 标签:法律,文档分析,数据集,自然语言处理,文本分类,机器学习,合规性,智能合约 数据概述: 该数据集包含法律文档的相关数据,记录了各类法律文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik

    2025年4月24日   

    俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,风格分析,机器学习,语言研究,情感分析,多语言处理 数据概述: 该数据集包含来自俄罗斯互联网公开来源的文本数据,记录了不同风格和语境下的文本样本。主要特征如下:...
    packageimg
  • 句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista

    2025年4月24日   

    句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,语言模型,数据分析,人工智能,教育技术 数据概述:...
    packageimg
  • 情感分析VADER分类器数据集SentimentAnalysisVADERClassifierDataset-cloudymts

    2025年4月24日   

    情感分析VADER分类器数据集SentimentAnalysisVADERClassifierDataset-cloudymts 数据来源:互联网公开数据 标签:情感分析,数据集,VADER,自然语言处理,文本分类,机器学习,社交媒体分析,数据分析 数据概述:该数据集包含来自公开社交媒体平台的文本数据,使用VADER(Valence Aware...
    packageimg
  • 泰米尔语情感分析数据集TamilFirstReadyforSentimentDataset-mayaabasu

    2025年4月24日   

    泰米尔语情感分析数据集TamilFirstReadyforSentimentDataset-mayaabasu 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,泰米尔语,机器学习,文本分类,多语言处理,情感挖掘 数据概述: 该数据集包含泰米尔语的文本数据,专门用于情感分析任务,记录了泰米尔语文本的情感倾向。主要特征如下:...
    packageimg
  • 有害评论分类测试数据集-akashsuper2000

    2025年4月24日   

    有害评论分类测试数据集-akashsuper2000 数据来源:互联网公开数据 标签:文本分类,自然语言处理,深度学习,机器学习,情感分析,评论分析,有害言论,数据集 数据概述:该数据集包含来自互联网的评论文本数据,用于有害评论的分类任务。主要特征如下: 时间跨度:数据记录时间跨度未知,但通常涵盖了近期互联网评论。...
    packageimg
  • 法律文本自然语言推理数据集LegalLensNLIDataset-nhddddz84

    2025年4月24日   

    法律文本自然语言推理数据集LegalLensNLIDataset-nhddddz84 数据来源:互联网公开数据 标签:法律文本,自然语言推理,数据集,法律研究,机器学习,语义分析,人工智能,文本分类 数据概述: 该数据集包含来自法律文本的自然语言推理(NLI)数据,记录了法律文档中的前提语句和假设语句及其之间的推理关系。主要特征如下:...
    packageimg
  • 华为自然语言处理公开数据集NLP-tttrrraaahhh

    2025年4月24日   

    华为自然语言处理公开数据集NLP-tttrrraaahhh 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器翻译,情感分析,文本分类,华为,NLP 数据概述: 该数据集由华为公司发布,包含了多种自然语言处理任务的公开数据集,旨在促进NLP领域的研究与发展。主要特征如下: 时间跨度: 数据发布时间跨度不定,涵盖不同年份的数据。...
    packageimg