-
综合标签数据集CombinedLabelledDataset-kathank
综合标签数据集CombinedLabelledDataset-kathank 数据来源:互联网公开数据 标签:综合标签,数据集,机器学习,文本分析,自然语言处理,分类,标注,数据科学 数据概述:该数据集包含来自多个来源的综合标签数据,记录了文本数据及其对应的标签,适用于机器学习和自然语言处理任务。主要特征如下:... -
标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe
标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe 数据来源:互联网公开数据 标签:情感分析,数据集,推特,自然语言处理,机器学习,文本分析,社交媒体,社会研究 数据概述:该数据集包含来自推特的标题数据,记录了推特用户发布的标题及其对应的情感标签。主要特征如下:... -
真假新闻辨识文章数据集-2016至2017年-abkrishna05
真假新闻辨识文章数据集-2016至2017年-abkrishna05 数据来源:互联网公开数据 标签:假新闻,真新闻,新闻分类,文本分析,数据集,信息验证,机器学习,文本挖掘 数据概述: 本数据集包含2016年至2017年间收集的真假新闻文章数据,共分为两个文件:Fake.csv 和... -
训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda
训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda 数据来源:互联网公开数据 标签:机器学习,自然语言处理,数据集,模型训练,文本分析,上下文理解,深度学习,人工智能 数据概述: 该数据集包含用于训练和修改模型上下文的数据,记录了用于提升模型理解和生成能力的文本数据。主要特征如下:... -
推特新冠疫情数据集TwitterCOVID-19Dataset-uracilo
推特新冠疫情数据集TwitterCOVID-19Dataset-uracilo 数据来源:互联网公开数据 标签:社交媒体,新冠疫情,数据集,流行病学,文本分析,机器学习,公共卫生,信息传播 数据概述: 该数据集包含来自Twitter平台与新冠疫情相关的公开帖子数据,记录了用户在疫情期间的讨论内容,互动情况及传播特征。主要特征如下:... -
书籍评论与推荐数据集BooksReviewsandRecommendationsDataset-annnguyen123
书籍评论与推荐数据集BooksReviewsandRecommendationsDataset-annnguyen123 数据来源:互联网公开数据 标签:书籍,评论,推荐系统,自然语言处理,文本分析,用户行为,机器学习,数据挖掘 数据概述:... -
安卓应用商店用户评论数据集AndroidPlaystoreReviewDataset-divanshu22
安卓应用商店用户评论数据集AndroidPlaystoreReviewDataset-divanshu22 数据来源:互联网公开数据 标签:用户评论,应用商店,数据集,文本分析,情感分析,机器学习,自然语言处理,用户体验 数据概述: 该数据集包含来自安卓应用商店的用户评论数据,记录了用户对各类应用的反馈和评价。主要特征如下:... -
文学作品按体裁分类数据集-mehedihasan9021
文学作品按体裁分类数据集-mehedihasan9021 数据来源:互联网公开数据 标签:文学,数据集,文本分析,自然语言处理,情感分析,分类,语料库,文本挖掘 数据概述: 该数据集包含按体裁分类的文学作品数据,旨在为文本分析和自然语言处理研究提供丰富的语料。主要特征如下: 时间跨度:数据涵盖不同时期和时代的文学作品。... -
科技创业新闻数据库TechCrunchNewsDatabase-crawlfeeds
科技创业新闻数据库TechCrunchNewsDatabase-crawlfeeds 数据来源:互联网公开数据 标签:科技新闻,创业公司,数据集,文本分析,机器学习,行业研究,新闻聚合,商业智能 数据概述: 该数据集包含来自科技博客TechCrunch的新闻文章数据,记录了科技创业领域的新闻动态和行业信息。主要特征如下:... -
基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99
基于自然语言处理的邮件钓鱼欺诈检测数据集-muhammedtariq99 数据来源:互联网公开数据 标签:钓鱼欺诈检测,自然语言处理,NLP,邮件安全,机器学习,文本分析,欺诈识别,安全防护 数据概述:... -
印地语维基百科数据集HindiWikipediaDataset-vjdwary
印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:... -
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch 数据来源:互联网公开数据 标签:德国联邦议院,演讲,文本分析,翻译,摘要,政治,NLP,自然语言处理,机器翻译,BART模型 数据概述: 本数据集包含1万篇德国联邦议院议员的演讲文本,这些演讲文本均来源于德国联邦议院官方网站。数据经过网络抓取,并使用OPUS-... -
阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad
阿塞拜疆语新闻评论数据集BİLDİRAZReviewsDataset-vrashad 数据来源:互联网公开数据 标签:新闻评论,数据集,文本分析,情感分析,自然语言处理,机器学习,阿塞拜疆语,语言技术 数据概述: 该数据集包含来自阿塞拜疆新闻网站BİLDİR AZ的用户评论数据,记录了用户对新闻内容的反馈和观点。主要特征如下:... -
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:... -
新冠疫情Twitter推文数据集COVID-19TweetsDataset-ankanderia
新冠疫情Twitter推文数据集COVID-19TweetsDataset-ankanderia 数据来源:互联网公开数据 标签:新冠疫情,推文数据,社交媒体,自然语言处理,情感分析,疫情研究,数据挖掘,文本分析 数据概述: 该数据集包含来自Twitter的关于新冠疫情的推文数据,记录了全球范围内用户在社交媒体上对疫情的讨论和观点。主要特征如下:... -
古兰经文本与地点数据集2023数据集-abdulbaqi
古兰经文本与地点数据集2023数据集-abdulbaqi 数据来源:互联网公开数据 标签:古兰经,文本分析,宗教研究,数据集,伊斯兰教,文化研究,文本挖掘,语言学 数据概述:该数据集包含来自公开来源的古兰经文本数据,记录了古兰经章节及其对应内容,并标注了其在伊斯兰教历史和文化中的重要地点。主要特征如下:... -
垃圾邮件与非垃圾邮件分类数据集Spam-HamData-liaichimustapha
垃圾邮件与非垃圾邮件分类数据集Spam-HamData-liaichimustapha 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,数据集,文本分析,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自公开邮件收集项目的数据,记录了电子邮件的分类信息,主要分为垃圾邮件(spam)和非垃圾邮件(ham)。主要特征如下:... -
网络钓鱼邮件类型识别数据集-160封邮件-charlottehall
网络钓鱼邮件类型识别数据集-160封邮件-charlottehall 数据来源:互联网公开数据 标签:网络钓鱼,电子邮件,类型识别,网络安全,数据集,文本分析,反垃圾邮件,电子邮件分类 数据概述:... -
Medium文章阅读时长预测数据集-vineeth1999
Medium文章阅读时长预测数据集-vineeth1999 数据来源:互联网公开数据 标签:文本分析,阅读时长预测,数据集,自然语言处理,机器学习,用户行为分析,内容推荐,数据挖掘 数据概述: 该数据集包含了来自Medium平台的文章数据和用户阅读时长信息,用于预测文章的阅读时长。主要特征如下:... -
自然语言处理数据集NLP数据集-mkmanoj353
自然语言处理数据集NLP数据集-mkmanoj353 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述:该数据集包含来自多个来源的自然语言处理数据,记录了大量文本数据以支持各种NLP任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...