找到3,840个数据集

标签: 文本分类

过滤结果
  • 阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596

    2025年5月29日   

    阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述:...
    packageimg
  • DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin

    2025年5月29日   

    DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,数据集,文本分类,机器学习,深度学习,文本分析,人工智能 数据概述:...
    packageimg
  • Yelp用户评论负样本数据集-che011

    2025年5月29日   

    Yelp用户评论负样本数据集-che011 数据来源:互联网公开数据 标签:用户评论,负样本,情感分析,自然语言处理,数据集,机器学习,文本分类,Yelp 数据概述:该数据集包含来自Yelp平台的负样本用户评论数据,主要用于情感分析和文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了Yelp平台上较早期的用户评论。...
    packageimg
  • 多领域语义匹配数据集MSMARCOModifiedDataset-n068968

    2025年5月29日   

    多领域语义匹配数据集MSMARCOModifiedDataset-n068968 数据来源:互联网公开数据 标签:自然语言处理,语义匹配,数据集,机器学习,信息检索,文本分类,深度学习,数据挖掘 数据概述: 该数据集是对MSMARCO数据集的改进版,包含来自多个领域的语义匹配数据,用于训练和评估文本匹配模型。主要特征如下:...
    packageimg
  • 问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar

    2025年5月29日   

    问题文本语义相似度判别数据集QuestionTextSemanticSimilarityJudgement-ojasgolatkar 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 问答系统, 语义分析, 文本分类, 机器学习, 深度学习, 数据标注 数据概述:...
    packageimg
  • 虚假新闻检测数据集LiarFakeNewsDetectionDataset-mubarakdaha

    2025年5月29日   

    虚假新闻检测数据集LiarFakeNewsDetectionDataset-mubarakdaha 数据来源:互联网公开数据 标签:虚假新闻,事实核查,自然语言处理,文本分类,机器学习,新闻分析,舆情分析,社会科学 数据概述: 该数据集包含来自PolitiFact网站的虚假新闻和事实核查数据,用于训练和评估虚假新闻检测模型。主要特征如下:...
    packageimg
  • 土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin

    2025年5月29日   

    土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻文章, 文本分类, 土耳其语, 内容分析, 类别识别, 自然语言处理, 机器学习, 语料库 数据概述: 该数据集包含来自土耳其TRT...
    packageimg
  • 词嵌入情感分析数据集D2VSentimentDataset-magomago

    2025年5月29日   

    词嵌入情感分析数据集D2VSentimentDataset-magomago 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,词嵌入,深度学习,文本分类,机器学习,情感词典 数据概述: 该数据集包含用于情感分析任务的文本数据,结合了分布式词向量(Doc2Vec)技术,旨在研究和评估文本情感的表达和识别。主要特征如下: 时间跨度:...
    packageimg
  • 虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar

    2025年5月29日   

    虚假评论分类数据集FakeReviewClassificationDataset-rahulluhar 数据来源:互联网公开数据 标签:虚假评论,数据集,自然语言处理,文本分类,机器学习,电商分析,情感分析,数据挖掘 数据概述: 该数据集包含来自电商平台或社交媒体的评论数据,记录了用户对产品或服务的评价内容及其真实性标签。主要特征如下:...
    packageimg
  • 文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv

    2025年5月29日   

    文本毒性分类嵌入数据集TextToxicityClassificationEmbeddingDataset-shikha130vv 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 嵌入向量, 深度学习, 自然语言处理, 模型训练, 情感分析, 机器学习 数据概述: 该数据集包含用于训练和评估文本毒性分类模型的嵌入向量数据。主要特征如下:...
    packageimg
  • Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat

    2025年5月29日   

    Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,恶意内容检测,数据集,Quora,深度学习,情感分析,NLP 数据概述: 该数据集来自Jigsaw...
    packageimg
  • 电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif

    2025年5月29日   

    电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:...
    packageimg
  • 新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl

    2025年5月29日   

    新冠疫情期间微博情感分析数据集COVID-19WeiboSentimentAnalysisDataset-raymondcl 数据来源:互联网公开数据 标签:疫情, 微博, 情感分析, 自然语言处理, 文本分类, 社交媒体, 情感倾向, 中文文本 数据概述:...
    packageimg
  • 文本分类数据集SISTextClassificationDataset-senylar

    2025年5月29日   

    文本分类数据集SISTextClassificationDataset-senylar 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息检索,人工智能 数据概述: 该数据集为SIS项目的一部分,主要包含用于文本分类任务的文本数据。主要特征如下:...
    packageimg
  • 文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh

    2025年5月29日   

    文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:...
    packageimg
  • 数据2020年Shopee代码联赛情感分析数据集-rareloto

    2025年5月29日   

    2020年Shopee代码联赛情感分析数据集-rareloto 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电商,Shopee,中文 数据概述: 该数据集来自2020年Shopee代码联赛,旨在用于情感分析任务,特别是针对电商平台上的用户评论。主要特征如下: 时间跨度:数据记录的时间范围为2020年。...
    packageimg
  • 中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari

    2025年5月29日   

    中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,数据集,中文,语言理解,文本分析,人工智能 数据概述: 该数据集是中文语言理解评测(CLUE)的一部分,主要包含中文文本的分类和标注数据,用于评估和训练自然语言处理模型。主要特征如下:...
    packageimg
  • BotezLive直播聊天记录分类数据集-brandonbenton

    2025年5月29日   

    BotezLive直播聊天记录分类数据集-brandonbenton 数据来源:互联网公开数据 标签:直播聊天,文本分类,数据集,机器学习,自然语言处理,游戏直播,社区互动,情感分析 数据概述: 该数据集包含了 BotezLive 直播平台的聊天记录,旨在用于文本分类和情感分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了...
    packageimg
  • 电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate

    2025年5月29日   

    电影评论情感分析模型数据集MovieReviewSentimentAnalysisModelDataset-johnekarate 数据来源:互联网公开数据 标签:情感分析, 电影评论, 自然语言处理, 深度学习, 文本分类, 数据集, 机器学习, PyTorch模型 数据概述:...
    packageimg
  • 学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990

    2025年5月29日   

    学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 语言学, 文本分类, 机器学习, 写作质量, 文本特征 数据概述: 该数据集包含学生写作文本,用于评估学生的写作水平。主要特征如下:...
    packageimg