-
土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin
土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin 数据来源:互联网公开数据 标签:土耳其新闻,健康,数据集,文本分析,自然语言处理,新闻媒体,医疗健康,舆情分析 数据概述: 该数据集包含来自土耳其新闻媒体的健康相关文章,旨在为研究者提供一个用于文本分析和自然语言处理的资源。主要特征如下:... -
医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq
医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq 数据来源:互联网公开数据 标签:医疗问答,数据集,自然语言处理,医学研究,健康咨询,机器学习,信息检索,文本分析 数据概述:该数据集包含来自MedQuad项目的医疗问答数据,记录了患者与医疗专业人员之间的问答互动。主要特征如下:... -
政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23
政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23 数据来源:互联网公开数据 标签:文本分析,词汇频率,社交媒体,数据集,政治研究,自然语言处理,机器学习,论坛分析... -
网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe
网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,社交网络,内容审核,有害言论 数据概述: 该数据集来源于Jigsaw组织提供的网络评论数据,记录了互联网平台上的用户评论,并标注了评论的情绪和毒性程度。主要特征如下:... -
情感分析与评论数据集
标题:情感分析与评论数据集 数据内容:该数据集包含两个主要字段,分别是“评论”和“情感”。其中,“评论”字段包含17,872种不同的值,代表了不同的用户评论内容;“情感”字段包含3种不同的值,表示评论的情感倾向(如正面、负面和中性)。 数据来源:互联网公开数据 数据用途: 1. 电子商务:可用于分析用户对产品或服务的评价,帮助企业优化产品和服务。 2.... -
情感分析与情绪分类数据集
标题:情感分析与情绪分类数据集 数据内容:本数据集包含了3289个不同的句子,每个句子都标注了相应的情绪和情感。情绪字段有6种不同的值,情感字段有2种不同的值。 数据来源:互联网公开数据... -
阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr
阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,语言模型,机器翻译,阿拉伯语 数据概述: 该数据集包含阿拉伯语文本数据,记录了不同主题和类别的阿拉伯语文章,评论或文档。主要特征如下:... -
情感与文本数据集
标题:情感与文本数据集 数据内容: 该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括: - 用户标识符(id) - 用户名(author) - 社区标识符(subreddit) - 链接标识符(link_id) - 父评论标识符(parent_id) - 时间戳(created_utc) - 评分者标识符(rater_id)... -
美国数据科学就业市场分析数据集-manish131186
美国数据科学就业市场分析数据集-manish131186 数据来源:互联网公开数据 标签:数据科学,就业市场,职位分析,美国,招聘信息,自然语言处理,机器学习,行业分析 数据概述: 该数据集包含了来自美国数据科学领域的招聘信息,旨在为分析就业市场趋势提供数据支持。主要特征如下: 时间跨度: 数据记录的时间范围从2020年初至2023年末。 地理范围:... -
挪威语评论情感分析数据集-文本情感分类-2024-ravaghi
挪威语评论情感分析数据集-文本情感分类-2024-ravaghi 数据来源:互联网公开数据 标签:情感分析,文本分类,挪威语,自然语言处理,机器学习,评论,NoReC,情感极性 数据概述:... -
Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui
Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui 数据来源:互联网公开数据 标签:图像,斯瓦希里语,多模态,自然语言处理,图像描述,数据集,机器翻译,计算机视觉 数据概述:... -
垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar
垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar 数据来源:互联网公开数据 标签:垃圾评论,数据集,文本分类,自然语言处理,机器学习,恶意内容检测,社交媒体,内容审核 数据概述: 该数据集包含来自社交媒体平台的评论数据,用于训练和评估垃圾评论检测模型。主要特征如下:... -
诗歌-议论文及散文文本数据集-huosiyuan
诗歌-议论文及散文文本数据集-huosiyuan 数据来源:互联网公开数据 标签:诗歌,议论文,散文,文本分析,自然语言处理,写作风格,文本分类,教育 数据概述:... -
新闻批次文章与图像描述数据集TheBatchArticlesandImageDescriptionsDataset-ivanhusarov
新闻批次文章与图像描述数据集TheBatchArticlesandImageDescriptionsDataset-ivanhusarov 数据来源:互联网公开数据 标签:新闻文章,图像描述,数据集,自然语言处理,计算机视觉,机器学习,内容分析,多媒体 数据概述: 该数据集包含来自新闻批次(The... -
越南大学情感分析数据集BinaryAspect-BasedSentimentAnalysisDataset-phngnguynvit
越南大学情感分析数据集BinaryAspect-BasedSentimentAnalysisDataset-phngnguynvit 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,数据集,越南语,深度学习,观点挖掘,情感分类 数据概述: 该数据集包含来自越南大学的文本数据,主要用于情感分析研究,侧重于方面级情感分析。主要特征如下:... -
聊天用语数据集ChatSlangDataset-muhammadbilal6305
聊天用语数据集ChatSlangDataset-muhammadbilal6305 数据来源:互联网公开数据 标签:聊天用语,社交媒体,数据集,自然语言处理,机器学习,文本分析,语言学,沟通研究 数据概述:该数据集包含来自社交媒体平台的聊天用语数据,记录了人们在聊天中使用的非正式语言,缩写和俚语。主要特征如下:... -
数据科学方向2020年文章元数据集TowardsDataScience2020PostsMetadataDataset-kevinndietrich
数据科学方向2020年文章元数据集TowardsDataScience2020PostsMetadataDataset-kevinndietrich 数据来源:互联网公开数据 标签:数据科学,文章元数据,数据集,内容分析,机器学习,自然语言处理,出版分析,教育研究 数据概述: 该数据集包含来自数据科学方向(Towards Data... -
维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez
维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez 数据来源:互联网公开数据 标签:电影,剧情,数据集,文本分析,自然语言处理,信息检索,机器学习,电影研究 数据概述: 该数据集包含来自维基百科的电影剧情摘要数据,记录了大量电影的剧情概要信息。主要特征如下:... -
罗马乌尔都语文本数据集-akarami
罗马乌尔都语文本数据集-akarami 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,文本数据,自然语言处理,语言学,数据集,机器学习,文本分析 数据概述: 该数据集包含了用罗马字母书写的乌尔都语文本。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代乌尔都语的使用。... -
英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar
英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar 数据来源:互联网公开数据 标签:机器翻译,英语,西班牙语,数据集,自然语言处理,文本翻译,双语资源,语言技术 数据概述: 该数据集包含英语到西班牙语的平行文本数据,主要记录了双语句子对,适用于机器翻译和自然语言处理任务。主要特征如下:...