-
主题建模数据集TopicModelingDataset-quangvinhtrnh
主题建模数据集TopicModelingDataset-quangvinhtrnh 数据来源:互联网公开数据 标签:主题建模,数据集,自然语言处理,文本分析,机器学习,数据挖掘,信息检索,文本挖掘 数据概述: 该数据集专注于主题建模任务,包含来自多个来源的文本数据,用于分析文本内容中的潜在主题。主要特征如下:... -
滚石杂志文章与实体识别数据集RollingStoneMagazineArticlesandEntityRecognitionDataset-derrickzhen
滚石杂志文章与实体识别数据集RollingStoneMagazineArticlesandEntityRecognitionDataset-derrickzhen 数据来源:互联网公开数据 标签:媒体分析,自然语言处理,实体识别,数据集,文本挖掘,机器学习,新闻分析,内容分析 数据概述: 该数据集包含来自滚石杂志(Rolling... -
南洋理工大学垃圾邮件数据集NUSSpamDatasetCleaned-johnsonubah
南洋理工大学垃圾邮件数据集NUSSpamDatasetCleaned-johnsonubah 数据来源:互联网公开数据 标签:垃圾邮件,数据集,邮件过滤,自然语言处理,机器学习,信息安全,文本分析,学术资源 数据概述:该数据集由南洋理工大学提供,主要用于垃圾邮件的识别和过滤。主要特征如下: 时间跨度:数据记录的时间范围从2002年到2004年。... -
亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro
亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro 数据来源:互联网公开数据 标签:亚马逊,意大利,评论,情感分析,评分,文本数据,自然语言处理,机器学习 数据概述: 本数据集包含来自亚马逊意大利站的商品评论,共计17,340条,每条评论均包含以下字段: score(评分):客户给出的评分,通常为1-5星。... -
亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55
亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55 数据来源:互联网公开数据 标签:商品评论,数据集,电子商务,自然语言处理,消费者行为,市场分析,用户反馈,文本挖掘 数据概述:该数据集包含来自亚马逊平台的商品评论数据,记录了用户对各种商品的评价。主要特征如下:... -
垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal
垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自多个来源的垃圾邮件和非垃圾邮件数据,记录了电子邮件的文本内容和分类标签。主要特征如下:... -
数据2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu
2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu 数据来源:互联网公开数据 标签:文本检索,COVID-19,数据集,信息检索,自然语言处理,机器学习,数据挖掘,公共卫生 数据概述:... -
汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29
汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29 数据来源:互联网公开数据 标签:汉字转写,拉丁文翻译,数据集,自然语言处理,文本转换,机器翻译,语言学,字符编码 数据概述: 该数据集包含汉字与拉丁文之间的翻译数据,适用于研究汉字转写为拉丁文的技术。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
僧伽罗语新闻标题数据集-nawarathnadeshan
僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,僧伽罗语,文本分类,情感分析,数据集,信息检索 数据概述: 该数据集包含来自僧伽罗语新闻网站的新闻标题数据,记录了各种新闻文章的标题信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围取决于数据集的构建时间。... -
数据2021年T20世界杯推文数据集-shahidkhan1
2021年T20世界杯推文数据集-shahidkhan1 数据来源:互联网公开数据 标签:推文数据,板球,T20世界杯,社交媒体分析,情感分析,自然语言处理,体育,数据集 数据概述: 该数据集包含了来自2021年T20世界杯期间的推文数据,记录了全球用户在社交媒体上关于赛事讨论的各种信息。主要特征如下:... -
新冠后低自尊关键词推文数据集10000TweetsofKeywordLowSelfEsteemPostCovidDataset-kareemrasheed89
新冠后低自尊关键词推文数据集10000TweetsofKeywordLowSelfEsteemPostCovidDataset-kareemrasheed89 数据来源:互联网公开数据 标签:社交媒体,心理健康,推文分析,情绪研究,自然语言处理,疫情后,大数据,情感分析 数据概述:... -
电子邮件垃圾邮件分类数据集EmailSpamClassifierDataset-prasaddablikar
电子邮件垃圾邮件分类数据集EmailSpamClassifierDataset-prasaddablikar 数据来源:互联网公开数据 标签:垃圾邮件,分类,数据集,机器学习,自然语言处理,文本分析,网络安全,数据挖掘 数据概述: 该数据集包含来自互联网公开渠道的电子邮件数据,记录了电子邮件的文本内容及其分类标签(垃圾邮件或正常邮件)。主要特征如下:... -
虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98
虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分析,信息检索,事实核查,新闻传播 数据概述: 该数据集包含用于虚假新闻检测的文本数据,记录了真实新闻和虚假新闻的文本内容。主要特征如下: 时间跨度:... -
电商商品评论情感分析数据集BinSentimentDataset-pranjaldub1999
电商商品评论情感分析数据集BinSentimentDataset-pranjaldub1999 数据来源:互联网公开数据 标签:电商评论,情感分析,数据集,自然语言处理,机器学习,消费者行为,市场研究,数据分析 数据概述: 该数据集包含来自电商平台的商品评论数据,记录了用户对商品的评价及其对应的情感标签,适用于情感分析和自然语言处理任务。主要特征如下:... -
循环神经网络桥梁数据集RNNBridgeDataset-twoone
循环神经网络桥梁数据集RNNBridgeDataset-twoone 数据来源:互联网公开数据 标签:循环神经网络,数据集,机器学习,神经网络,时间序列,序列建模,深度学习,自然语言处理 数据概述: 该数据集专注于循环神经网络(RNN)在桥梁结构健康监测中的应用,记录了桥梁在不同负载和条件下的传感器数据。主要特征如下:... -
多标签文本分类数据集-bimleshkumar759
多标签文本分类数据集-bimleshkumar759 数据来源:互联网公开数据 标签:文本分类,多标签,数据集,机器学习,自然语言处理,文本分析,深度学习,NLP 数据概述: 该数据集包含用于多标签文本分类任务的文本数据。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始数据来源。 地理范围: 数据覆盖范围不固定,取决于原始数据来源。... -
新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem
新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem 数据来源:互联网公开数据 标签:新闻,文章分类,数据集,文本分析,机器学习,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的文章数据,记录了不同类别的新闻文章内容及其分类标签。主要特征如下:... -
WorldStar视频评论数据集WorldStarCommentsDataset-dataranch
WorldStar视频评论数据集WorldStarCommentsDataset-dataranch 数据来源:互联网公开数据 标签:视频评论,社交媒体,文本分析,情感分析,自然语言处理,数据集,舆情分析,用户行为 数据概述: 该数据集包含了来自WorldStarHipHop网站的视频评论数据,记录了用户对各类视频的评论内容。主要特征如下:... -
土耳其语IMDB电影评论情感分析数据集-yusufgoktas
土耳其语IMDB电影评论情感分析数据集-yusufgoktas 数据来源:互联网公开数据 标签:情感分析,土耳其语,电影评论,自然语言处理,文本分类,机器学习,NLP,土耳其 数据概述: 该数据集包含了来自互联网电影数据库(IMDB)的土耳其语电影评论数据,用于情感分析任务。主要特征如下:... -
学生成绩评估阈值数据集EvaluatingStudentWritingwithThresholdDataset-phanttan
学生成绩评估阈值数据集EvaluatingStudentWritingwithThresholdDataset-phanttan 数据来源:互联网公开数据 标签:学生成绩,评估,阈值,教育,数据分析,机器学习,自然语言处理,教育技术 数据概述:该数据集包含来自多个教育机构的学生成绩评估数据,记录了学生的写作样本及相应的评估分数。主要特征如下:...