找到11,747个数据集

标签: 自然语言处理

过滤结果
  • 社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411

    2025年4月24日   

    社交媒体文本中的冒犯性语言识别数据集OffensiveSpanishIdentificationinSocialMediaTexts-shashankpandey2411 数据来源:互联网公开数据 标签:社交媒体,语言识别,数据集,文本分析,机器学习,自然语言处理,情感分析,西班牙语 数据概述:...
    packageimg
  • 语言检测数据集LanguageDetectionDataset-trinhtung

    2025年4月24日   

    语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:...
    packageimg
  • 情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf

    2025年4月24日   

    情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,NLP,二分类,情感倾向 数据概述: 该数据集包含来自斯坦福情感树库(Stanford Sentiment Treebank, SST)的情感倾向分类数据,记录了句子的情感极性。主要特征如下:...
    packageimg
  • 垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab

    2025年4月24日   

    垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,数据集,机器学习,邮件过滤,文本分析,信息检索 数据概述:该数据集包含来自SpamAssassin项目的邮件数据,用于训练和测试垃圾邮件过滤系统。主要特征如下:...
    packageimg
  • 多语言翻译标签数据集TagsandTranslationDataset-outlook0

    2025年4月24日   

    多语言翻译标签数据集TagsandTranslationDataset-outlook0 数据来源:互联网公开数据 标签:多语言翻译,数据集,标签管理,自然语言处理,机器翻译,文本分析,数据科学,信息处理 数据概述: 该数据集包含了来自多个来源的标签及其多语言翻译,适用于标签管理和多语言系统的构建。主要特征如下:...
    packageimg
  • 摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine

    2025年4月24日   

    摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,情感分析,机器学习,自然语言处理,情感研究,多语言处理 数据概述:该数据集包含来自摩洛哥社交媒体平台的推文数据,记录了用户发布的推文内容及情感倾向。主要特征如下:...
    packageimg
  • 泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss

    2025年4月24日   

    泰国新闻分类数据集ThaiNewsClassificationDataset-mssjss 数据来源:互联网公开数据 标签:新闻分类,文本处理,数据集,机器学习,自然语言处理,多语言,信息检索,数据挖掘 数据概述: 该数据集包含来自泰国新闻网站的新闻文章数据,记录了不同类别新闻的分类信息。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集MovieCommentSentimentAnalysisDataset-chavdadhruv

    2025年4月24日   

    电影评论情感分析数据集MovieCommentSentimentAnalysisDataset-chavdadhruv 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,文本挖掘,机器学习,情感分类,影评 数据概述: 该数据集包含了来自互联网的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 自然语言处理数据集ANLP概览-ankitmakhija98

    2025年4月24日   

    自然语言处理数据集ANLP概览-ankitmakhija98 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,NLP,语料库,语言模型,人工智能 数据概述: 该数据集汇总了各种自然语言处理(NLP)数据集,涵盖了文本分类,情感分析,机器翻译,文本生成,问答系统等多种NLP任务。主要特征如下: 时间跨度:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych 数据来源:互联网公开数据 标签:新闻分析,虚假新闻,数据集,文本分类,机器学习,自然语言处理,传播学,信息安全 数据概述: 该数据集包含来自互联网公开渠道的新闻文章数据,记录了真假新闻的特征和标签。主要特征如下:...
    packageimg
  • 数据2019年印度尼西亚总统选举推特数据集Pilpres2019TweetDataset-shaniasalsabillaq

    2025年4月24日   

    2019年印度尼西亚总统选举推特数据集Pilpres2019TweetDataset-shaniasalsabillaq 数据来源:互联网公开数据 标签:推特,社交媒体,政治,选举,情感分析,自然语言处理,印度尼西亚,数据集 数据概述: 该数据集包含了来自推特(Twitter)的公开数据,记录了关于2019年印度尼西亚总统选举的推文信息。主要特征如下:...
    packageimg
  • 多分类电子邮件数据集-amalverma27

    2025年4月24日   

    多分类电子邮件数据集-amalverma27 数据来源:互联网公开数据 标签:电子邮件,文本分类,垃圾邮件检测,自然语言处理,机器学习,数据集,邮件安全,信息检索 数据概述: 该数据集包含电子邮件数据,旨在用于文本分类和垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含历史邮件数据。...
    packageimg
  • 客户服务口语评估数据集-bitext

    2025年4月24日   

    客户服务口语评估数据集-bitext 数据来源:互联网公开数据 标签:客户服务,口语评估,数据集,自然语言处理,情感分析,对话分析,机器学习,语音识别 数据概述: 该数据集包含客户服务领域的口语对话数据,用于评估和分析客户服务中的口语表达。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的客户服务对话。...
    packageimg
  • 程序员Facebook帖子互动数据集ProgrammerFacebookPostEngagementDataset-purwonopurwono

    2025年4月24日   

    程序员Facebook帖子互动数据集ProgrammerFacebookPostEngagementDataset-purwonopurwono 数据来源:互联网公开数据 标签:社交媒体,程序员,Facebook,帖子互动,数据分析,自然语言处理,机器学习,用户行为 数据概述:...
    packageimg
  • 电影流派数据集GenresDataset-bambii21

    2025年4月24日   

    电影流派数据集GenresDataset-bambii21 数据来源:互联网公开数据 标签:电影,流派,数据集,电影分析,推荐系统,自然语言处理,文化研究,娱乐行业 数据概述: 该数据集包含来自公开电影数据库的数据,记录了不同电影的流派信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx

    2025年4月24日   

    藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx 数据来源:互联网公开数据 标签:藏文文献,命名实体识别,数据集,自然语言处理,机器学习,学术研究,文本分析,语言学 数据概述:该数据集包含来自藏文文献的引文数据,用于命名实体识别(NER)任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira

    2025年4月24日   

    维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:...
    packageimg
  • 银行客户评论数据集BankCustomerReviewsDataset-romanberdyshev

    2025年4月24日   

    银行客户评论数据集BankCustomerReviewsDataset-romanberdyshev 数据来源:互联网公开数据 标签:银行评论,数据集,客户反馈,情感分析,金融行业,客户服务,用户体验,自然语言处理 数据概述: 该数据集包含来自不同银行客户的评论数据,记录了客户对银行服务的反馈和评价。主要特征如下:...
    packageimg
  • 苏萨索人工智能数据集SUSATHOAIDataset-saniyatlamim007

    2025年4月24日   

    苏萨索人工智能数据集SUSATHOAIDataset-saniyatlamim007 数据来源:互联网公开数据 标签:人工智能,数据集,机器学习,自然语言处理,图像识别,深度学习,计算机视觉,智能技术 数据概述: 该数据集包含来自苏萨索的研究数据,记录了人工智能领域的研究进展,应用案例和技术方法。主要特征如下:...
    packageimg
  • 立场检测数据集StanceDetectionDataset-ad6398

    2025年4月24日   

    立场检测数据集StanceDetectionDataset-ad6398 数据来源:互联网公开数据 标签:立场检测,文本分析,自然语言处理,数据集,情感分析,观点挖掘,机器学习,舆情分析 数据概述: 该数据集包含用于立场检测任务的文本数据,旨在识别文本中对特定目标或主题的立场。主要特征如下:...
    packageimg