-
-
推特灾难事件分析数据集DisastrousTweetTestDataset-rexrobotics
推特灾难事件分析数据集DisastrousTweetTestDataset-rexrobotics 数据来源:互联网公开数据 标签:推特数据,灾难事件,文本分析,自然语言处理,情感分析,机器学习,危机管理,社交媒体 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与灾难事件相关的推文。主要特征如下:... -
电影概述数据集MoviesOverviewDataset-favouroyinbo
电影概述数据集MoviesOverviewDataset-favouroyinbo 数据来源:互联网公开数据 标签:电影,数据集,文本分析,情感分析,自然语言处理,娱乐行业,机器学习,内容分析 数据概述: 该数据集包含来自多个电影数据库的电影概述数据,记录了各类电影的简介信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。... -
越南餐厅评论数据集VietnamRestaurantReviewDataset-huynhnhanthap
越南餐厅评论数据集VietnamRestaurantReviewDataset-huynhnhanthap 数据来源:互联网公开数据 标签:餐饮评论,数据集,文本分析,机器学习,情感分析,自然语言处理,消费者行为,商业智能 数据概述: 该数据集包含来自越南多家餐厅的顾客评论数据,记录了消费者对餐厅的评价和反馈。主要特征如下:... -
深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1
深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1 数据来源:互联网公开数据 标签:深度学习,语言模型,数据集,自然语言处理,机器学习,人工智能,文本分析,数据挖掘 数据概述: 该数据集包含用于训练和开发语言模型的数据,主要面向深度学习领域的模型训练和评估。主要特征如下:... -
讽刺文本评价数据集-kolliparajaswanth030
讽刺文本评价数据集-kolliparajaswanth030 数据来源:互联网公开数据 标签:讽刺检测,情感分析,自然语言处理,文本分析,数据集,机器学习,语言学,文本分类 数据概述: 该数据集包含了用于讽刺文本评价的文本数据,旨在帮助研究人员和开发者构建和评估讽刺检测模型。主要特征如下: 时间跨度:数据收集时间不限,反映了不同时期和语境下的讽刺表达。... -
电影特征数据集-元数据与文本-anniejose
电影特征数据集-元数据与文本-anniejose 数据来源:互联网公开数据 标签:电影,元数据,文本分析,IMDB,TMDB,娱乐行业,预测模型,文本挖掘 数据概述: 本数据集包含了从IMDB数据集编译并补充了通过TMDB... -
诺维雅语料库数据集NoviaKorpusDataset-noviafadina
诺维雅语料库数据集NoviaKorpusDataset-noviafadina 数据来源:互联网公开数据 标签:语料库,语言学,文本分析,自然语言处理,芬兰语,数据集,文本挖掘,词汇研究 数据概述: 该数据集包含来自诺维雅应用科学大学(Novia University of Applied... -
LinkedIn招聘职位信息抓取数据集ScrapingJobFormLinkedInDataset-esraaabdelrazek
LinkedIn招聘职位信息抓取数据集ScrapingJobFormLinkedInDataset-esraaabdelrazek 数据来源:互联网公开数据 标签:招聘数据,LinkedIn,职位信息,数据抓取,文本分析,自然语言处理,求职,职业发展 数据概述:... -
词汇索引数据集WordIndexesDataset-virenmohanlal
词汇索引数据集WordIndexesDataset-virenmohanlal 数据来源:互联网公开数据 标签:语言学,词汇索引,数据集,文本分析,自然语言处理,教育研究,数据挖掘,语言学习 数据概述: 该数据集包含词汇索引数据,记录了词汇的索引,频率,词性等信息。主要特征如下: 时间跨度:数据记录的时间范围未明确说明,可能覆盖多个时间段。... -
网络评论毒性检测数据集JigsawToxicityDetectionDataset-fjklmn
网络评论毒性检测数据集JigsawToxicityDetectionDataset-fjklmn 数据来源:互联网公开数据 标签:网络评论,毒性检测,数据集,自然语言处理,机器学习,文本分析,情感分析,社交媒体 数据概述:该数据集来自Jigsaw团队,记录了来自Reddit平台的网络评论及其标签,适用于毒性评论检测和自然语言处理研究。主要特征如下:... -
历史法西斯主义演说数据集-eternalstorm
历史法西斯主义演说数据集-eternalstorm 数据来源:互联网公开数据 标签:法西斯主义,演说,历史,政治,NLP,文本分析,希特勒,墨索里尼,斯大林,毛泽东,公共领域 数据概述:... -
英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai
英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,数据集,文本分析,机器学习,NLP,语言学,评估 数据概述: 该数据集包含用于评估英语句子语义相似度的测试数据。主要特征如下: 时间跨度: 数据记录的时间范围为数据集发布时间。 地理范围:... -
社交媒体评论数据集CommentDataDataset-jiangshanzhizhu
社交媒体评论数据集CommentDataDataset-jiangshanzhizhu 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,自然语言处理,机器学习,数据挖掘,用户行为 数据概述: 该数据集包含来自多个社交媒体平台的用户评论数据,记录了用户在特定话题或产品上的互动和反馈。主要特征如下:... -
世界杯Twitter数据集2018年TwitterWorldCupDataset2018-arushig
世界杯Twitter数据集2018年TwitterWorldCupDataset2018-arushig 数据来源:互联网公开数据 标签:社交媒体,世界杯,Twitter,数据集,文本分析,情感分析,体育赛事,机器学习 数据概述: 该数据集包含来自2018年世界杯期间Twitter平台上的相关数据,记录了用户对世界杯赛事的讨论和互动。主要特征如下:... -
自动情感分析数据集AES2FoldsDataset-syhens
自动情感分析数据集AES2FoldsDataset-syhens 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分析,数据挖掘,人工智能,情感识别 数据概述: 该数据集包含来自自动情感分析研究的数据,记录了文本内容的情感倾向和情感强度。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
乌克兰诗歌数据集UkrainianPoemsDataset-viktoriashvets
乌克兰诗歌数据集UkrainianPoemsDataset-viktoriashvets 数据来源:互联网公开数据 标签:诗歌,乌克兰,文学,文化研究,自然语言处理,文本分析,数据集,诗歌翻译 数据概述: 该数据集包含乌克兰诗歌的文本数据,旨在为研究乌克兰文学和文化提供资源。主要特征如下: 时间跨度:... -
新闻语料库词频统计数据集-2023-pduvvuri0308
新闻语料库词频统计数据集-2023-pduvvuri0308 数据来源:互联网公开数据 标签:词频统计,新闻语料库,文本分析,自然语言处理,NLP,数据集,文本挖掘 数据概述:... -
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang 数据来源:互联网公开数据 标签:越南语,拼写错误,数据集,自然语言处理,机器学习,语言学研究,文本分析,错误检测 数据概述: 该数据集包含越南语中的拼写错误数据,记录了越南语文本中的错误拼写及其正确形式。主要特征如下:... -
垃圾短信分类数据集SpamSMSClassificationDataset-arafat1746
垃圾短信分类数据集SpamSMSClassificationDataset-arafat1746 数据来源:互联网公开数据 标签:短信分类,垃圾信息,数据集,文本分析,机器学习,自然语言处理,信息过滤,通信安全 数据概述: 该数据集包含来自公开短信数据源的短信信息,记录了用户接收的短信内容及其分类标签(垃圾短信或正常短信)。主要特征如下:...