-
自然语言处理项目数据集NLPProjectDataset-chiraayupravin
自然语言处理项目数据集NLPProjectDataset-chiraayupravin 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,数据挖掘,文本分类 数据概述: 该数据集为自然语言处理项目的一部分,主要记录了用于文本分析,语言模型训练等任务的数据。主要特征如下:... -
Reddit社区评论文本与参数数据集-takeshiiijima
Reddit社区评论文本与参数数据集-takeshiiijima 数据来源:互联网公开数据 标签:社交媒体,Reddit,评论,文本分析,自然语言处理,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自Reddit社区的评论数据,并附有相应的文本参数。主要特征如下: 时间跨度:数据记录的时间跨度未知,取决于Reddit公开数据的获取时间范围。... -
自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg
自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg 数据来源:互联网公开数据 标签:自然语言处理,词袋模型,数据集,文本分类,机器学习,文本分析,数据挖掘,信息检索 数据概述: 该数据集包含自然语言处理中词袋模型的提交数据,记录了文本分类,关键词提取等任务的样本和标签。主要特征如下:... -
统计学专业毕业论文数据集数据集-tirtainovan
统计学专业毕业论文数据集数据集-tirtainovan 数据来源:互联网公开数据 标签:统计学,毕业论文,数据集,文本分析,学术研究,自然语言处理,论文写作,学术资源 数据概述: 该数据集包含统计学专业毕业论文的文本数据,旨在为学术研究和数据分析提供支持。主要特征如下: 时间跨度:数据记录的时间范围涵盖了近年来统计学专业毕业论文。... -
自然语言处理NLP最终项目数据集-prasadmagdum
自然语言处理NLP最终项目数据集-prasadmagdum 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,文本分类,信息提取,深度学习 数据概述: 该数据集是为自然语言处理最终项目设计的,包含了多种文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的来源。... -
土耳其健康新闻数据集TurkishHealthNewsDataset-denizhanahin
土耳其健康新闻数据集TurkishHealthNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,健康,数据集,土耳其,文本分析,自然语言处理,医疗信息,机器学习 数据概述: 该数据集包含来自土耳其公开渠道的健康相关新闻文章,记录了与健康,医疗,公共卫生等主题相关的新闻报道。主要特征如下:... -
新闻摘要数据集NewsSummaryDataset-usmannwaheed
新闻摘要数据集NewsSummaryDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻,摘要,数据集,文本分析,自然语言处理,机器学习,信息提取,文本生成 数据概述: 该数据集包含来自互联网的新闻文章及其对应的摘要,记录了新闻内容的关键信息。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2017年。... -
反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk
反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器学习,数据集,语义理解,情感识别,深度学习 数据概述: 该数据集包含来自社交媒体和在线评论的反讽文本数据,记录了包含反讽表达的文本及其对应的嵌入表示。主要特征如下:... -
英国航空公司旅客评价数据集BritishAirwaysAirlineReviewsDataset-dinanabil811
英国航空公司旅客评价数据集BritishAirwaysAirlineReviewsDataset-dinanabil811 数据来源:互联网公开数据 标签:航空业,旅客评价,数据集,客户满意度,文本分析,机器学习,情感分析,商业智能 数据概述: 该数据集包含来自英国航空公司的旅客评价数据,记录了旅客对英国航空服务的反馈和评价。主要特征如下:... -
翻译数据集TranslatedDataset-waelfezari
翻译数据集TranslatedDataset-waelfezari 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,文本分析,语言学,多语言,深度学习,文本对齐 数据概述: 该数据集包含多种语言的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的创建时间。... -
词向量模型数据集GloVe-mlethics
词向量模型数据集GloVe-mlethics 数据来源:互联网公开数据 标签:词向量,自然语言处理,文本分析,机器学习,深度学习,语义分析,词嵌入,NLP 数据概述: 该数据集包含了由斯坦福大学开发的GloVe(Global Vectors for Word Representation)词向量模型。主要特征如下:... -
增强数据自然语言处理数据集AugmentdData-NLP-ahmedmohamed365
增强数据自然语言处理数据集AugmentdData-NLP-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本增强,数据扩充,机器学习,深度学习,文本分析,NLP 数据概述: 该数据集包含增强的自然语言处理(NLP)数据,旨在提升NLP模型的性能和鲁棒性。主要特征如下: 时间跨度:... -
翻译项目CSV数据集TranslatedCSVDataset-ahensetihom
翻译项目CSV数据集TranslatedCSVDataset-ahensetihom 数据来源:互联网公开数据 标签:翻译项目,CSV数据,语言处理,自然语言处理,数据集,文本分析,机器学习,多语言研究 数据概述:该数据集包含来自多个翻译项目的CSV格式数据,记录了不同语言文本之间的翻译结果。主要特征如下:... -
多类别短信数据集MulticlassSMSDataset-sahanr
多类别短信数据集MulticlassSMSDataset-sahanr 数据来源:互联网公开数据 标签:短信分类,数据集,自然语言处理,机器学习,文本分析,情感分析,通信技术,文本分类 数据概述: 该数据集包含来自公开来源的短信数据,记录了不同类别的短信内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。... -
航空公司旅客评价数据集AirlinePassengerReviewsDataset-tahayna
航空公司旅客评价数据集AirlinePassengerReviewsDataset-tahayna 数据来源:互联网公开数据 标签:航空业,旅客评价,数据集,文本分析,情感分析,机器学习,自然语言处理,客户服务 数据概述: 该数据集包含来自各大航空公司的旅客评价数据,记录了乘客对航空服务的反馈和评分。主要特征如下:... -
维基百科数据集DCWikiDataCSV-jungwoonseok
维基百科数据集DCWikiDataCSV-jungwoonseok 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,学术资源,知识图谱 数据概述:该数据集包含来自维基百科的数据,记录了大量维基百科页面的内容和属性。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad
垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad 数据来源:互联网公开数据 标签:垃圾邮件检测,数据集,电子邮件分析,机器学习,信息过滤,网络安全,数据科学,文本分析 数据概述: 该数据集包含来自多个来源的电子邮件数据,用于垃圾邮件检测任务。主要特征如下:... -
推特情感分析数据集TwitterTaperaDataset-unshoytable
推特情感分析数据集TwitterTaperaDataset-unshoytable 数据来源:互联网公开数据 标签:推特,情感分析,数据集,自然语言处理,机器学习,社会媒体,文本分析,人工智能 数据概述:该数据集包含来自推特的文本数据,记录了用户发表的推文及其对应的情感标签,适用于情感分析,自然语言处理等任务。主要特征如下:... -
Reddit烹饪论坛讨论数据RedditCookForumDiscussionData-vaishnavibv
Reddit烹饪论坛讨论数据RedditCookForumDiscussionData-vaishnavibv 数据来源:互联网公开数据 标签:烹饪,论坛,Reddit,文本分析,自然语言处理,情感分析,社交媒体,饮食 数据概述:该数据集包含来自Reddit烹饪论坛(r/Cooking)的讨论数据,记录了用户发布的帖子,评论及其相关信息。主要特征如下:... -
乌尔都语罗马转写数据集RomanUrduDataset-favadhassanjaskani
乌尔都语罗马转写数据集RomanUrduDataset-favadhassanjaskani 数据来源:互联网公开数据 标签:自然语言处理,乌尔都语,罗马转写,文本分析,机器学习,语言学,文本数据,情感分析 数据概述: 该数据集包含乌尔都语的罗马转写文本数据,记录了用罗马字母书写的乌尔都语内容。主要特征如下:...