找到11,989个数据集

标签: 自然语言处理

过滤结果
  • 虚假新闻检测数据集FakeNewsChallengeDataset-quentinducoulombier

    2025年4月24日   

    虚假新闻检测数据集FakeNewsChallengeDataset-quentinducoulombier 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分类,信息传播,数据分析,新闻媒体 数据概述: 该数据集来自虚假新闻挑战赛(Fake News Challenge),记录了网络新闻文本及其真实性标签。主要特征如下:...
    packageimg
  • 越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911

    2025年4月24日   

    越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911 数据来源:互联网公开数据 标签:语言学习,翻译,数据集,自然语言处理,机器学习,越南语,文本分析,语言技术 数据概述: 该数据集包含来自越南语翻译项目的数据,记录了越南语与其它语言(如英语,中文等)之间的翻译数据。主要特征如下:...
    packageimg
  • 讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef

    2025年4月24日   

    讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,情感识别,人工智能,语言模型 数据概述: 该数据集包含来自社交媒体,新闻评论和论坛等公开来源的文本数据,记录了用户生成内容中的讽刺表达。主要特征如下:...
    packageimg
  • 文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser

    2025年4月24日   

    文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser 数据来源:互联网公开数据 标签:文本分析,TF-IDF,数据集,自然语言处理,机器学习,信息检索,文本挖掘,文本特征 数据概述: 该数据集包含来自公开提交的文本特征提取数据,记录了通过TF-IDF方法提取的文本特征。主要特征如下:...
    packageimg
  • 心理健康常见问题解答数据集MentalHealthFAQDataset-mahmoudsaadmohamed

    2025年4月24日   

    心理健康常见问题解答数据集MentalHealthFAQDataset-mahmoudsaadmohamed 数据来源:互联网公开数据 标签:心理健康,常见问题,数据集,问答系统,自然语言处理,情感分析,医疗健康,知识图谱 数据概述: 该数据集包含来自各种来源的心理健康相关的常见问题解答。主要特征如下:...
    packageimg
  • 表情符号预测数据集EmojiPredictionDataset-anantyadav

    2025年4月24日   

    表情符号预测数据集EmojiPredictionDataset-anantyadav 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,情感计算,文本挖掘,计算机科学,数据挖掘 数据概述:该数据集包含用于表情符号预测的文本数据,记录了与表情符号相关的文本内容和对应的表情符号标签。主要特征如下:...
    packageimg
  • O2O电商评论数据集O2OShopCommentDataset-yuzhanu

    2025年4月24日   

    O2O电商评论数据集O2OShopCommentDataset-yuzhanu 数据来源:互联网公开数据 标签:电商评论,数据集,消费者行为,自然语言处理,情感分析,机器学习,商业智能,市场研究 数据概述: 该数据集包含来自O2O电商平台(线上到线下)的用户评论数据,记录了消费者对商品和服务的反馈信息。主要特征如下:...
    packageimg
  • 命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin

    2025年4月24日   

    命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin 数据来源:互联网公开数据 标签:命名实体识别, 数据集, 自然语言处理, 机器学习, Keras, 人工智能, 文本分析, 语义理解 数据概述:...
    packageimg
  • 社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411

    2025年4月24日   

    社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411 数据来源:互联网公开数据 标签:社交媒体,语言识别,数据集,文本分析,机器学习,自然语言处理,情感分析,西班牙语 数据概述:...
    packageimg
  • 语言检测数据集LanguageDetectionDataset-trinhtung

    2025年4月24日   

    语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:...
    packageimg
  • 情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf

    2025年4月24日   

    情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,NLP,二分类,情感倾向 数据概述: 该数据集包含来自斯坦福情感树库(Stanford Sentiment Treebank, SST)的情感倾向分类数据,记录了句子的情感极性。主要特征如下:...
    packageimg
  • 垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab

    2025年4月24日   

    垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,数据集,机器学习,邮件过滤,文本分析,信息检索 数据概述:该数据集包含来自SpamAssassin项目的邮件数据,用于训练和测试垃圾邮件过滤系统。主要特征如下:...
    packageimg
  • 多语言翻译标签数据集TagsandTranslationDataset-outlook0

    2025年4月24日   

    多语言翻译标签数据集TagsandTranslationDataset-outlook0 数据来源:互联网公开数据 标签:多语言翻译,数据集,标签管理,自然语言处理,机器翻译,文本分析,数据科学,信息处理 数据概述: 该数据集包含了来自多个来源的标签及其多语言翻译,适用于标签管理和多语言系统的构建。主要特征如下:...
    packageimg
  • 摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine

    2025年4月24日   

    摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,情感分析,机器学习,自然语言处理,情感研究,多语言处理 数据概述:该数据集包含来自摩洛哥社交媒体平台的推文数据,记录了用户发布的推文内容及情感倾向。主要特征如下:...
    packageimg
  • 泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss

    2025年4月24日   

    泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss 数据来源:互联网公开数据 标签:新闻分类,文本处理,数据集,机器学习,自然语言处理,多语言,信息检索,数据挖掘 数据概述: 该数据集包含来自泰国新闻网站的新闻文章数据,记录了不同类别新闻的分类信息。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集MovieCommentSentimentAnalysisDataset-chavdadhruv

    2025年4月24日   

    电影评论情感分析数据集MovieCommentSentimentAnalysisDataset-chavdadhruv 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,文本挖掘,机器学习,情感分类,影评 数据概述: 该数据集包含了来自互联网的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 自然语言处理数据集ANLP概览-ankitmakhija98

    2025年4月24日   

    自然语言处理数据集ANLP概览-ankitmakhija98 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,NLP,语料库,语言模型,人工智能 数据概述: 该数据集汇总了各种自然语言处理(NLP)数据集,涵盖了文本分类,情感分析,机器翻译,文本生成,问答系统等多种NLP任务。主要特征如下: 时间跨度:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych 数据来源:互联网公开数据 标签:新闻分析,虚假新闻,数据集,文本分类,机器学习,自然语言处理,传播学,信息安全 数据概述: 该数据集包含来自互联网公开渠道的新闻文章数据,记录了真假新闻的特征和标签。主要特征如下:...
    packageimg
  • 数据2019年印度尼西亚总统选举推特数据集Pilpres2019TweetDataset-shaniasalsabillaq

    2025年4月24日   

    2019年印度尼西亚总统选举推特数据集Pilpres2019TweetDataset-shaniasalsabillaq 数据来源:互联网公开数据 标签:推特,社交媒体,政治,选举,情感分析,自然语言处理,印度尼西亚,数据集 数据概述: 该数据集包含了来自推特(Twitter)的公开数据,记录了关于2019年印度尼西亚总统选举的推文信息。主要特征如下:...
    packageimg
  • 多分类电子邮件数据集-amalverma27

    2025年4月24日   

    多分类电子邮件数据集-amalverma27 数据来源:互联网公开数据 标签:电子邮件,文本分类,垃圾邮件检测,自然语言处理,机器学习,数据集,邮件安全,信息检索 数据概述: 该数据集包含电子邮件数据,旨在用于文本分类和垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含历史邮件数据。...
    packageimg