找到11,761个数据集

标签: 自然语言处理

过滤结果
  • 二十新闻组文本分类数据集-thedevastator

    2025年4月21日   

    二十新闻组文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,新闻组,机器学习,数据集,自然语言处理,文本分析 数据概述: 本数据集包含约20,000篇新闻组文档,这些文档被分为20个不同的新闻组。数据集最初由Ken...
    packageimg
  • 游戏评论数据集GameReviewsDataset-kanishknavale

    2025年4月25日   

    游戏评论数据集GameReviewsDataset-kanishknavale 数据来源:互联网公开数据 标签:游戏,评论,数据集,自然语言处理,情感分析,用户体验,市场研究,数据挖掘 数据概述: 该数据集包含来自各大游戏平台和社交媒体的游戏评论数据,记录了玩家对各类游戏的评价和反馈。主要特征如下:...
    packageimg
  • 信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya

    2025年4月25日   

    信息检索查询数据集RetrievalQueriesDataset-gsaichaitanya 数据来源:互联网公开数据 标签:信息检索,查询分析,数据集,搜索引擎,自然语言处理,数据挖掘,人工智能,机器学习 数据概述: 该数据集包含了来自多个搜索引擎和在线信息检索系统的用户查询数据,记录了用户在搜索过程中的查询语句及相关信息。主要特征如下:...
    packageimg
  • 罗马字母转泰卢固文字符数据集RomantoTeluguCharacterConversionDataset-dushyantsingh1

    2025年4月25日   

    罗马字母转泰卢固文字符数据集RomantoTeluguCharacterConversionDataset-dushyantsingh1 数据来源:互联网公开数据 标签:语言转换,字符编码,数据集,泰卢固语,自然语言处理,文本转换,机器学习,语言学 数据概述:...
    packageimg
  • 美国YouTube评论情感分析清洗数据集

    2025年4月25日   

    美国YouTube评论情感分析清洗数据集 数据来源:互联网公开数据 标签:YouTube评论,情感分析,文本数据,自然语言处理,情感分类,机器学习,数据清洗,社交媒体 数据概述:...
    packageimg
  • 疫情前10000条推特数据分析数据集Pre-COVID-1910-000TweetsDataset-kareemrasheed89

    2025年4月25日   

    疫情前10000条推特数据分析数据集Pre-COVID-1910-000TweetsDataset-kareemrasheed89 数据来源:互联网公开数据 标签:社交媒体,数据分析,数据集,文本挖掘,情感分析,机器学习,情感识别,自然语言处理 数据概述:...
    packageimg
  • 用户反馈意见分析数据集-uom200644f

    2025年4月25日   

    用户反馈意见分析数据集-uom200644f 数据来源:互联网公开数据 标签:用户反馈,情感分析,文本挖掘,自然语言处理,数据集,意见挖掘,客户服务,机器学习 数据概述: 该数据集包含来自不同渠道的用户反馈意见,记录了用户对产品,服务或体验的评价。主要特征如下: 时间跨度:数据记录的时间范围不确定,取决于数据源的更新频率。...
    packageimg
  • 客户服务工单数据集-vijaythurimella

    2025年4月25日   

    客户服务工单数据集-vijaythurimella 数据来源:互联网公开数据 标签:客户服务,工单,文本分析,自然语言处理,机器学习,服务质量,客户体验,数据分析 数据概述: 该数据集包含客户服务工单数据,记录了客户与服务提供商之间的互动信息。主要特征如下: 时间跨度:数据记录的时间范围,从[起始年份]到[结束年份]。...
    packageimg
  • ArgRewritev2语料库数据集-nghtctrl

    2025年4月25日   

    ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。...
    packageimg
  • 词向量与文档向量生成数据集WordandDoc2VecDataset-wordroid

    2025年4月25日   

    词向量与文档向量生成数据集WordandDoc2VecDataset-wordroid 数据来源:互联网公开数据 标签:自然语言处理,词向量,文档向量,数据集,机器学习,文本分析,向量化,文本挖掘 数据概述:该数据集包含用于生成词向量(Word2Vec)和文档向量(Doc2Vec)的数据,记录了文本语料库的词汇和文档特征。主要特征如下:...
    packageimg
  • 微博七模态数据集Weibo7ModesDataSet-ginrawin

    2025年4月25日   

    微博七模态数据集Weibo7ModesDataSet-ginrawin 数据来源:互联网公开数据 标签:微博,数据集,多模态,社交媒体,自然语言处理,图像处理,音频处理 数据概述: 该数据集包含来自微博的七模态数据,记录了用户发布的微博内容及其相关多媒体信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg
  • 垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg

    2025年4月25日   

    垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg 数据来源:互联网公开数据 标签:文本分类,垃圾短信,数据集,自然语言处理,机器学习,数据挖掘,通信安全,信息安全 数据概述:...
    packageimg
  • 图像情感分析数据集-a45632

    2025年4月25日   

    图像情感分析数据集-a45632 数据来源:互联网公开数据 标签:图像情感,情感分析,数据集,计算机视觉,深度学习,自然语言处理,多模态,情感识别 数据概述: 该数据集包含图像及其对应的情感标签,用于训练和评估图像情感分析模型。主要特征如下: 时间跨度:数据记录的时间范围不限。 地理范围:数据来源不限,涵盖全球范围的图像。...
    packageimg
  • 社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar

    2025年4月25日   

    社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,数据集,自然语言处理,机器学习,文本分类,情感分析,网络安全 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的内容中是否包含仇恨言论的标注信息。主要特征如下:...
    packageimg
  • YouTube视频ID-标题-描述及分类数据集YouTubeVideosID-Title-Description-andCategoryDataset-h...

    2025年4月25日   

    YouTube视频ID-标题-描述及分类数据集YouTubeVideosID-Title-Description-andCategoryDataset-harshitmakkar 数据来源:互联网公开数据 标签:视频分析,数据集,自然语言处理,内容分类,机器学习,多媒体,社交媒体,数据挖掘 数据概述:...
    packageimg
  • 土耳其体育新闻数据2024年4月数据集-denizhanahin

    2025年4月25日   

    土耳其体育新闻数据2024年4月数据集-denizhanahin 数据来源:互联网公开数据 标签:体育新闻,土耳其,数据集,文本分析,自然语言处理,新闻报道,体育赛事,情感分析 数据概述: 该数据集包含来自土耳其的体育新闻数据,记录了2024年4月期间的体育新闻报道。主要特征如下: 时间跨度:数据记录的时间范围为2024年4月。...
    packageimg
  • 亚马逊产品数据及评论情感分析数据集AmazonProductDataandReviewsSentimentAnalysisDataset-tamilara...

    2025年4月25日   

    亚马逊产品数据及评论情感分析数据集AmazonProductDataandReviewsSentimentAnalysisDataset-tamilarasanpravin 数据来源:互联网公开数据 标签:电子商务,产品评论,情感分析,数据集,机器学习,自然语言处理,数据挖掘,消费者行为 数据概述:...
    packageimg
  • 图书推荐系统数据集-soumyaeharidas

    2025年4月25日   

    图书推荐系统数据集-soumyaeharidas 数据来源:互联网公开数据 标签:图书推荐,协同过滤,数据集,机器学习,自然语言处理,用户行为,个性化推荐,图书信息 数据概述: 该数据集包含了来自图书推荐系统的数据,主要记录了用户对图书的评价和相关信息。主要特征如下: 时间跨度:数据记录的时间范围未知,主要反映了用户在一段时间内的图书阅读和评价行为。...
    packageimg
  • 虚假新闻识别数据集RealFakeNewsDataset-abdelrhamanfakhry

    2025年4月25日   

    虚假新闻识别数据集RealFakeNewsDataset-abdelrhamanfakhry 数据来源:互联网公开数据 标签:新闻,虚假信息,数据集,文本分析,自然语言处理,机器学习,舆情分析,信息检索 数据概述: 该数据集包含来自不同来源的新闻文章,旨在用于虚假新闻的检测和识别研究。主要特征如下:...
    packageimg
  • Care-com社区Reddit帖子数据集Care-comRedditPostsDataset-johnoren

    2025年4月25日   

    Care-com社区Reddit帖子数据集Care-comRedditPostsDataset-johnoren 数据来源:互联网公开数据 标签:社交媒体,数据集,Reddit,育儿,家庭服务,情感分析,自然语言处理,文本挖掘 数据概述: 该数据集包含来自 Reddit 的 Care.com 社区的帖子数据,记录了用户在 Care.com...
    packageimg