找到11,989个数据集

标签: 自然语言处理

过滤结果
  • 垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs

    2025年4月24日   

    垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs 数据来源:互联网公开数据 标签:垃圾邮件,邮件过滤,数据集,自然语言处理,文本分类,机器学习,信息检索,垃圾邮件检测 数据概述: 该数据集包含了大量标记为垃圾邮件(spam)和正常邮件(ham)的邮件数据,主要用于垃圾邮件过滤模型的训练和评估。主要特征如下:...
    packageimg
  • 电影用户评论数据集16部电影烂番茄评论数据集-jonsteve

    2025年4月24日   

    电影用户评论数据集16部电影烂番茄评论数据集-jonsteve 数据来源:互联网公开数据 标签:电影评论,数据集,电影分析,自然语言处理,情感分析,用户反馈,电影推荐,娱乐研究 数据概述:该数据集包含来自烂番茄网站的16部电影的用户评论数据,记录了用户对这些电影的具体评价和评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil

    2025年4月24日   

    医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil 数据来源:互联网公开数据 标签:医疗对话,自然语言处理,数据集,医疗AI,临床分析,机器学习,健康咨询,对话系统 数据概述: 该数据集包含来自医疗场景的医生与患者对话记录,记录了医生与患者之间的交流内容。主要特征如下:...
    packageimg
  • 自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk

    2025年4月24日   

    自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,文本分析,机器学习,人工智能,语言模型,对比研究 数据概述:...
    packageimg
  • YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty

    2025年4月24日   

    YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty 数据来源:互联网公开数据 标签:视频字幕,数据集,自然语言处理,文本分析,机器学习,数据挖掘,多媒体,人工智能 数据概述: 该数据集包含来自YouTube平台的视频字幕数据,记录了视频内容的文字转录信息。主要特征如下:...
    packageimg
  • 法律领域分类数据集LegalAreasClassificationDataset-mohit3430

    2025年4月24日   

    法律领域分类数据集LegalAreasClassificationDataset-mohit3430 数据来源:互联网公开数据 标签:法律,数据集,分类,机器学习,自然语言处理,文本分析,人工智能,法律研究 数据概述: 该数据集包含来自法律领域的文本数据,记录了不同法律领域的案例,法规和判决等信息。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra

    2025年4月24日   

    电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据集,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自 UCI 机器学习数据库的电子邮件数据,用于垃圾邮件过滤研究。主要特征如下: 时间跨度:数据记录时间不明确,但可推断为收集于互联网早期。...
    packageimg
  • 深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh

    2025年4月24日   

    深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh 数据来源:互联网公开数据 标签:自然语言处理,深度学习,数据集,文本分析,机器学习,语言模型,文本分类,情感分析 数据概述:该数据集包含用于自然语言处理的深度学习模型训练和评估的数据,记录了多种文本类型和任务的数据。主要特征如下:...
    packageimg
  • 统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny

    2025年4月24日   

    统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny 数据来源:互联网公开数据 标签:统计分析,词频计数,数据集,文本分析,自然语言处理,文本挖掘,数据科学,数据处理 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同文本的词频计数信息,适用于文本分析和词频统计等任务。主要特征如下:...
    packageimg
  • 推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147

    2025年4月24日   

    推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147 数据来源:互联网公开数据 标签:推特,退休,数据集,社交媒体,文本分析,情感分析,自然语言处理,用户行为 数据概述: 该数据集包含推特(Twitter)上与退休相关的数据,记录了用户发布的推文信息。主要特征如下:...
    packageimg
  • 预处理与词形还原测试数据数据集-marouanesidali

    2025年4月24日   

    预处理与词形还原测试数据数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,数据集,文本分析,机器学习,NLP,测试数据 数据概述: 该数据集包含了经过预处理和词形还原处理的文本数据,主要用于测试和评估文本处理算法的性能。主要特征如下:...
    packageimg
  • IMDB电影评分与评论数据集IMDBMovieRatingsandReviewsDataset-cdr0101

    2025年4月24日   

    IMDB电影评分与评论数据集IMDBMovieRatingsandReviewsDataset-cdr0101 数据来源:互联网公开数据 标签:电影评分,用户评论,数据集,情感分析,自然语言处理,数据挖掘,电影研究,机器学习 数据概述:...
    packageimg
  • 极端言论检测数据集ExtremismDetectionDataset-ftgroups

    2025年4月24日   

    极端言论检测数据集ExtremismDetectionDataset-ftgroups 数据来源:互联网公开数据 标签:文本分析,极端言论,数据集,机器学习,自然语言处理,安全研究,社会研究,情感分析 数据概述: 该数据集包含来自网络平台和社交媒体的文本数据,记录了不同类型的极端言论内容。主要特征如下:...
    packageimg
  • Pneuma基准测试数据集-luthfibalaka

    2025年4月24日   

    Pneuma基准测试数据集-luthfibalaka 数据来源:互联网公开数据 标签:Pneuma,基准测试,自然语言处理,机器学习,文本生成,模型评估,文本分析,人工智能 数据概述:该数据集包含Pneuma项目发布的基准测试数据,用于评估自然语言处理模型的性能,特别是在文本生成和文本理解方面。主要特征如下:...
    packageimg
  • 英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba

    2025年4月24日   

    英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba 数据来源:互联网公开数据 标签:自然语言处理,意图分类,数据集,机器学习,双语,文本分析,语言模型,机器翻译 数据概述: 该数据集记录了英语和法语文本的意图分类信息,主要用于训练和评估跨语言的意图识别模型。主要特征如下:...
    packageimg
  • 加密货币与人工智能应用数据集CryptocurrencyandAIApplicationDataset-tristexinhan

    2025年4月24日   

    加密货币与人工智能应用数据集CryptocurrencyandAIApplicationDataset-tristexinhan 数据来源:互联网公开数据 标签:加密货币,人工智能,数据集,金融科技,机器学习,自然语言处理,市场分析,预测分析 数据概述:...
    packageimg
  • 客服对话训练数据集KefuConversationTrainDataset-eyeshield23

    2025年4月24日   

    客服对话训练数据集KefuConversationTrainDataset-eyeshield23 数据来源:互联网公开数据 标签:客服对话,数据集,自然语言处理,机器学习,文本分析,对话系统,人工智能,语言模型 数据概述: 该数据集包含来自客服系统的对话数据,记录了客服与用户的交互记录。主要特征如下:...
    packageimg
  • 电影数据集用于自然语言处理文本预处理TMDBDatasetforTextPreprocessinginNLP-sugunapriya

    2025年4月24日   

    电影数据集用于自然语言处理文本预处理TMDBDatasetforTextPreprocessinginNLP-sugunapriya 数据来源:互联网公开数据 标签:电影数据,自然语言处理,文本预处理,数据集,情感分析,机器学习,文本挖掘,数据科学 数据概述: 该数据集来自The Movie...
    packageimg
  • 文本数据分析数据集DatasetforTextualDataAnalysis-par7h0

    2025年4月24日   

    文本数据分析数据集DatasetforTextualDataAnalysis-par7h0 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,情感分析,文本挖掘,数据科学,信息处理 数据概述: 该数据集包含来自互联网公开渠道的文本数据,记录了各类文本内容及其相关属性。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • Seneweb网站新闻文章数据集-barabaradiop

    2025年4月24日   

    Seneweb网站新闻文章数据集-barabaradiop 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,情感分析,舆情分析,新闻媒体,信息检索 数据概述:该数据集包含来自Seneweb网站的新闻文章数据,记录了Seneweb网站发布的各类新闻文章信息。主要特征如下:...
    packageimg