找到3,840个数据集

标签: 文本分类

过滤结果
  • 问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat

    2025年4月23日   

    问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,命令识别,问题分析,语言模型,智能问答 数据概述:...
    packageimg
  • 垃圾短信检测数据集SMSSpamDataset-hanzvivatma

    2025年4月23日   

    垃圾短信检测数据集SMSSpamDataset-hanzvivatma 数据来源:互联网公开数据 标签:文本分类,垃圾短信,自然语言处理,机器学习,数据集,短信,NLP,文本分析 数据概述: 该数据集包含了大量短信文本数据,用于垃圾短信的检测与识别。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了短信内容在一定时间内的收集。 地理范围:...
    packageimg
  • 灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3

    2025年4月23日   

    灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3 数据来源:互联网公开数据 标签:自然语言处理,灾害应急,文本分类,数据集,机器学习,信息检索,危机管理,社会媒体分析 数据概述:该数据集包含来自Twitter的推文数据,记录了与灾害事件相关的文本信息。主要特征如下:...
    packageimg
  • 有毒评论测试数据集-husanrahmatullayev

    2025年4月23日   

    有毒评论测试数据集-husanrahmatullayev 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,有毒内容,机器学习,评论数据,文本分类 数据概述: 该数据集包含用于测试有毒评论检测模型的文本数据,记录了各种类型的在线评论,并标注了其毒性。主要特征如下:...
    packageimg
  • 越南语文本分类数据集-trnthinph

    2025年4月23日   

    越南语文本分类数据集-trnthinph 数据来源:互联网公开数据 标签:越南语,文本分类,自然语言处理,数据集,情感分析,语言学,机器学习,文本挖掘 数据概述: 该数据集包含越南语文本数据,并按照不同的类别进行标注。主要特征如下: 时间跨度:数据记录的时间范围无明确限制,取决于文本的发布时间。...
    packageimg
  • 阿姆哈拉语新闻文本分类数据集

    2025年4月23日   

    阿姆哈拉语新闻文本分类数据集 数据来源:互联网公开数据 标签:阿姆哈拉语,新闻分类,文本分类,自然语言处理,机器学习, Ethiopic script,基准性能 数据概述:...
    packageimg
  • 垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha

    2025年4月23日   

    垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha 数据来源:互联网公开数据 标签:垃圾邮件,情感分析,数据集,文本分类,自然语言处理,机器学习,文本挖掘,信息检索 数据概述: 该数据集包含了电子邮件数据,用于垃圾邮件检测和情感分析任务。主要特征如下:...
    packageimg
  • 有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain

    2025年4月23日   

    有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,情感分析,网络安全,德语,仇恨言论 数据概述: 该数据集由Jigsaw竞赛提供,包含德语评论数据,用于有毒评论的识别和分类。主要特征如下:...
    packageimg
  • 以色列与哈马斯冲突新闻报道纽约时报数据集2024年-2024年6月26日-dalaiaguirre

    2025年4月23日   

    以色列与哈马斯冲突新闻报道纽约时报数据集2024年-2024年6月26日-dalaiaguirre 数据来源:互联网公开数据 标签:以色列,哈马斯,战争,新闻报道,New York Times,NYT,NLP,文本分类,情感分析,命名实体识别 数据概述:...
    packageimg
  • 网络仇恨言论识别数据集HateSpeechRecoDataset-shinnurathod

    2025年4月23日   

    网络仇恨言论识别数据集HateSpeechRecoDataset-shinnurathod 数据来源:互联网公开数据 标签:仇恨言论,数据集,情感分析,自然语言处理,机器学习,社交媒体,文本分类,网络安全 数据概述: 该数据集包含来自社交媒体平台和网络论坛的文本数据,记录了用户发布的内容及其标签,用于识别和分类仇恨言论。主要特征如下:...
    packageimg
  • BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad

    2025年4月23日   

    BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分析,深度学习,语言模型,AI研究,文本分类 数据概述:该数据集包含通过BERT模型处理后的文本数据结果,记录了BERT模型对输入文本的分析和处理输出。主要特征如下:...
    packageimg
  • 网页链接与描述数据集-fan1dy

    2025年4月23日   

    网页链接与描述数据集-fan1dy 数据来源:互联网公开数据 标签:网页链接,文本分析,数据挖掘,自然语言处理,信息检索,文本分类,网络数据,数据集 数据概述: 该数据集包含来自互联网的网页链接,网页标题和网页描述信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于抓取时间,但涵盖了大量的网页数据。 地理范围:数据覆盖全球范围内的网页。...
    packageimg
  • 自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar

    2025年4月23日   

    自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,文本分类,人工智能,语言技术...
    packageimg
  • 在线欺凌文本数据集-agadaunogwu

    2025年4月23日   

    在线欺凌文本数据集-agadaunogwu 数据来源:互联网公开数据 标签:网络欺凌,文本数据,自然语言处理,情感分析,机器学习,社交媒体,文本分类,恶意言论 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用户之间的在线欺凌行为。主要特征如下: 时间跨度:数据记录的时间范围为未知,但包含了近期社交媒体上的文本信息。...
    packageimg
  • 斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha

    2025年4月23日   

    斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,自然语言处理,机器学习,数据集,情感识别,NLP 数据概述: 该数据集由斯坦福大学提供,包含了来自IMDb的电影评论数据,主要用于情感分析研究。主要特征如下:...
    packageimg
  • 产品标题分类数据集

    2025年4月23日   

    产品标题分类数据集 数据来源:互联网公开数据 标签:产品标题,文本分类,电子商务,数据挖掘,机器学习,深度学习,自然语言处理 数据概述: 本数据集包含来自亚马逊美国、加拿大和英国站点的产品标题及其对应类别信息,数据规模超过500万条样本,涵盖700多个细分类别。数据集中的产品标题经过清洗和标注,提供了标准化的分类标签,适用于文本分类任务。...
    packageimg
  • 电影剧本片段与电影类型匹配数据集-lykin22

    2025年4月23日   

    电影剧本片段与电影类型匹配数据集-lykin22 数据来源:互联网公开数据 标签:电影,剧本,类型,文本分类,机器学习,自然语言处理,剧情,喜剧,动作,科幻,爱情,恐怖,冒险,悬疑 数据概述: 本数据集包含训练集和测试集两部分,旨在用于电影剧本片段的类型预测任务。训练集包括三个字段: id:记录的唯一标识符...
    packageimg
  • 电子邮件意图识别数据集-nikhilhestabit

    2025年4月23日   

    电子邮件意图识别数据集-nikhilhestabit 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,电子邮件,意图识别,机器学习,情感分析,信息检索 数据概述: 该数据集包含来自电子邮件的数据,旨在用于电子邮件意图识别任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了多种不同时间段的电子邮件。...
    packageimg
  • 社交媒体互动与情感分析数据集

    2025年4月23日   

    标题:社交媒体互动与情感分析数据集 数据内容: 本数据集包含来自互联网公开数据的社交媒体互动记录,具体数据元素包括:用户ID、社交媒体平台(如Facebook)、互动内容(如帖子或评论)、情感标签(如Positive、Irrelevant)、互动时间等。数据内容涵盖了用户在社交媒体上的各种互动行为及其情感倾向。 数据来源: 互联网公开数据 数据用途:...
    packageimg
  • Jigsaw社区毒性评论严重度排名竞赛公共排行榜数据集-2021年12月27日-krist0phersmith

    2025年4月23日   

    Jigsaw社区毒性评论严重度排名竞赛公共排行榜数据集-2021年12月27日-krist0phersmith 数据来源:互联网公开数据 标签:Jigsaw,毒性评论,评论分析,自然语言处理,NLP,竞赛,排行榜,机器学习,文本分类 数据概述: 本数据集是Jigsaw 毒性评论严重度排名竞赛的公共排行榜快照,于2021年12月27日下载。...
    packageimg