找到11,736个数据集

标签: 自然语言处理

过滤结果
  • Jigsaw社区毒性评论严重度排名竞赛公共排行榜数据集-2021年12月27日-krist0phersmith

    2025年4月23日   

    Jigsaw社区毒性评论严重度排名竞赛公共排行榜数据集-2021年12月27日-krist0phersmith 数据来源:互联网公开数据 标签:Jigsaw,毒性评论,评论分析,自然语言处理,NLP,竞赛,排行榜,机器学习,文本分类 数据概述: 本数据集是Jigsaw 毒性评论严重度排名竞赛的公共排行榜快照,于2021年12月27日下载。...
    packageimg
  • 聊天机器人交互数据数据集ChatbotInteractionDataDataset-phmanhth

    2025年4月23日   

    聊天机器人交互数据数据集ChatbotInteractionDataDataset-phmanhth 数据来源:互联网公开数据 标签:聊天机器人,交互数据,数据集,自然语言处理,人工智能,机器学习,语言模型,对话系统 数据概述:该数据集包含来自多个聊天机器人的交互数据,记录了用户与机器人之间的对话内容。主要特征如下:...
    packageimg
  • 电影概述数据集MoviesOverviewDataset-favouroyinbo

    2025年4月23日   

    电影概述数据集MoviesOverviewDataset-favouroyinbo 数据来源:互联网公开数据 标签:电影,数据集,文本分析,情感分析,自然语言处理,娱乐行业,机器学习,内容分析 数据概述: 该数据集包含来自多个电影数据库的电影概述数据,记录了各类电影的简介信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。...
    packageimg
  • 情感分析数据集SentimentsDataset-muhammadukasha09

    2025年4月23日   

    情感分析数据集SentimentsDataset-muhammadukasha09 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,情感识别,数据科学,人工智能 数据概述: 该数据集包含来自互联网公开渠道的情感分析数据,记录了不同文本内容的情感倾向(如正面,负面,中性)。主要特征如下:...
    packageimg
  • 越南虚假新闻数据集VietnameseFakeNewsDataset-sonwqh

    2025年4月23日   

    越南虚假新闻数据集VietnameseFakeNewsDataset-sonwqh 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分类,新闻分析,数据挖掘,越南语 数据概述: 该数据集包含来自互联网的越南语新闻文章,旨在识别和分类虚假新闻。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2021年。...
    packageimg
  • 越南餐厅评论数据集VietnamRestaurantReviewDataset-huynhnhanthap

    2025年4月23日   

    越南餐厅评论数据集VietnamRestaurantReviewDataset-huynhnhanthap 数据来源:互联网公开数据 标签:餐饮评论,数据集,文本分析,机器学习,情感分析,自然语言处理,消费者行为,商业智能 数据概述: 该数据集包含来自越南多家餐厅的顾客评论数据,记录了消费者对餐厅的评价和反馈。主要特征如下:...
    packageimg
  • 深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1

    2025年4月23日   

    深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1 数据来源:互联网公开数据 标签:深度学习,语言模型,数据集,自然语言处理,机器学习,人工智能,文本分析,数据挖掘 数据概述: 该数据集包含用于训练和开发语言模型的数据,主要面向深度学习领域的模型训练和评估。主要特征如下:...
    packageimg
  • 大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo

    2025年4月23日   

    大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,文本重写,上下文理解,数据集,语言模型 数据概述: 本数据集包含来自LLM提示恢复竞赛的丰富文本数据,每个条目包括原始文本、使用的提示、简化的提示以及AI生成的重写文本。该数据集揭示了Gemma...
    packageimg
  • 社交媒体情感分析数据集TwitterDataforSentimentAnalysisDataset-subhamila

    2025年4月23日   

    社交媒体情感分析数据集TwitterDataforSentimentAnalysisDataset-subhamila 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本挖掘,大数据,数据科学 数据概述: 该数据集包含来自Twitter平台的大量推文数据,记录了用户发布的文本内容及其情感倾向。主要特征如下:...
    packageimg
  • 讽刺文本评价数据集-kolliparajaswanth030

    2025年4月23日   

    讽刺文本评价数据集-kolliparajaswanth030 数据来源:互联网公开数据 标签:讽刺检测,情感分析,自然语言处理,文本分析,数据集,机器学习,语言学,文本分类 数据概述: 该数据集包含了用于讽刺文本评价的文本数据,旨在帮助研究人员和开发者构建和评估讽刺检测模型。主要特征如下: 时间跨度:数据收集时间不限,反映了不同时期和语境下的讽刺表达。...
    packageimg
  • 孟加拉语词汇数据集-公交玛玛项目-rafsun

    2025年4月23日   

    孟加拉语词汇数据集-公交玛玛项目-rafsun 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,NLP,公交玛玛,学生出行,聊天机器人,词汇数据 数据概述: 本数据集是为公交玛玛项目中的聊天机器人功能而收集,旨在支持孟加拉语的交流,方便学生公交出行。数据集包含六种类型的数据,具体如下: stop_words:停用词,共385个...
    packageimg
  • 产品分类数据集-itsrohanism

    2025年4月23日   

    产品分类数据集-itsrohanism 数据来源:互联网公开数据 标签:产品分类,数据集,文本分类,自然语言处理,机器学习,电商,商品信息,数据挖掘 数据概述: 该数据集包含来自电商平台的产品信息,记录了各种产品的详细描述和类别标签。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期电商平台上的产品信息。...
    packageimg
  • 诺维雅语料库数据集NoviaKorpusDataset-noviafadina

    2025年4月23日   

    诺维雅语料库数据集NoviaKorpusDataset-noviafadina 数据来源:互联网公开数据 标签:语料库,语言学,文本分析,自然语言处理,芬兰语,数据集,文本挖掘,词汇研究 数据概述: 该数据集包含来自诺维雅应用科学大学(Novia University of Applied...
    packageimg
  • LinkedIn招聘职位信息抓取数据集ScrapingJobFormLinkedInDataset-esraaabdelrazek

    2025年4月23日   

    LinkedIn招聘职位信息抓取数据集ScrapingJobFormLinkedInDataset-esraaabdelrazek 数据来源:互联网公开数据 标签:招聘数据,LinkedIn,职位信息,数据抓取,文本分析,自然语言处理,求职,职业发展 数据概述:...
    packageimg
  • 词汇索引数据集WordIndexesDataset-virenmohanlal

    2025年4月23日   

    词汇索引数据集WordIndexesDataset-virenmohanlal 数据来源:互联网公开数据 标签:语言学,词汇索引,数据集,文本分析,自然语言处理,教育研究,数据挖掘,语言学习 数据概述: 该数据集包含词汇索引数据,记录了词汇的索引,频率,词性等信息。主要特征如下: 时间跨度:数据记录的时间范围未明确说明,可能覆盖多个时间段。...
    packageimg
  • 网络评论毒性检测数据集JigsawToxicityDetectionDataset-fjklmn

    2025年4月23日   

    网络评论毒性检测数据集JigsawToxicityDetectionDataset-fjklmn 数据来源:互联网公开数据 标签:网络评论,毒性检测,数据集,自然语言处理,机器学习,文本分析,情感分析,社交媒体 数据概述:该数据集来自Jigsaw团队,记录了来自Reddit平台的网络评论及其标签,适用于毒性评论检测和自然语言处理研究。主要特征如下:...
    packageimg
  • 越南语情感分析数据集-datvuthanh

    2025年4月23日   

    越南语情感分析数据集-datvuthanh 数据来源:互联网公开数据 标签:情感分析,自然语言处理,越南语,数据集,文本分类,机器学习,社交媒体,观点挖掘 数据概述: 该数据集包含越南语文本,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录时间跨度未知,但主要反映了越南语社交媒体和评论中常见的情感表达。...
    packageimg
  • IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib

    2025年4月23日   

    IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-ahmadialkhatib 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,文本分类,数据集,深度学习,IMDB 数据概述:...
    packageimg
  • 最后生还者系列游戏评论数据集-2011至2023-lazaro97

    2025年4月23日   

    最后生还者系列游戏评论数据集-2011至2023-lazaro97 数据来源:互联网公开数据 标签:视频游戏,评论,游戏评价,玩家反馈,游戏分析,游戏批评,数据挖掘,文本分类,自然语言处理 数据概述:...
    packageimg
  • 英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai

    2025年4月23日   

    英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,数据集,文本分析,机器学习,NLP,语言学,评估 数据概述: 该数据集包含用于评估英语句子语义相似度的测试数据。主要特征如下: 时间跨度: 数据记录的时间范围为数据集发布时间。 地理范围:...
    packageimg