-
土耳其餐厅评论情感分析数据集-2024-mertsengil
土耳其餐厅评论情感分析数据集-2024-mertsengil 数据来源:互联网公开数据 标签:土耳其语,情感分析,方面级情感分析,餐厅评论,NLP,文本分析,机器学习,自然语言处理 数据概述:... -
人类对话文本数据集HumanChatDataset-josepjuli
人类对话文本数据集HumanChatDataset-josepjuli 数据来源:互联网公开数据 标签:人类对话,文本数据,自然语言处理,聊天记录,语言模型,机器学习,对话系统,文本分析 数据概述:该数据集包含来自互联网的大量人类对话文本,记录了不同场景下的对话记录。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
文本预处理与词形还原训练数据集-marouanesidali
文本预处理与词形还原训练数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,机器学习,文本分析,数据集,NLP,训练数据 数据概述: 该数据集包含了经过预处理和词形还原的文本数据,主要用于训练和评估自然语言处理模型。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于原始文本数据集的构成。... -
垃圾邮件与正常邮件分类数据集SpamHamMessagesDataset-zenomarhoum
垃圾邮件与正常邮件分类数据集SpamHamMessagesDataset-zenomarhoum 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息安全 数据概述: 该数据集包含来自公开邮件来源的邮件数据,记录了垃圾邮件和正常邮件的文本内容。主要特征如下:... -
情感分析通用数据集-shankhad
情感分析通用数据集-shankhad 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,数据集,机器学习,情感分类,情绪识别,文本挖掘,中文 数据概述: 该数据集包含来自多个来源的文本数据,用于情感分析任务,旨在识别文本中表达的情感倾向。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时期和语境下的文本数据。... -
大规模语言模型增强数据集LLMAugmentedData-zhenghao97
大规模语言模型增强数据集LLMAugmentedData-zhenghao97 数据来源:互联网公开数据 标签:语言模型,数据集,数据增强,自然语言处理,文本生成,机器学习,文本分析,人工智能 数据概述: 该数据集包含由大规模语言模型(LLM)生成和增强的文本数据,旨在用于训练和评估各种自然语言处理(NLP)模型。主要特征如下:... -
垃圾邮件检测测试数据集SpamTestDataset-maureenekwems
垃圾邮件检测测试数据集SpamTestDataset-maureenekwems 数据来源:互联网公开数据 标签:垃圾邮件,数据集,邮件分类,机器学习,文本分析,分类算法,自然语言处理,网络安全 数据概述: 该数据集包含来自电子邮件服务的邮件数据,记录了不同邮件的分类标签(垃圾邮件或非垃圾邮件)。主要特征如下: 时间跨度:... -
自然语言处理入门数据集NLPStartedDataset-liangyou
自然语言处理入门数据集NLPStartedDataset-liangyou 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,机器学习,数据集,文本分类,情感分析,语言模型,入门 数据概述: 该数据集包含多个文本数据集,旨在帮助初学者入门自然语言处理领域。主要特征如下:... -
数据10000条样本语言识别数据集-amitverma2030
10000条样本语言识别数据集-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,文本分类,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含10000条文本样本,用于语言识别任务。主要特征如下: 时间跨度:数据无明确的时间范围,为静态数据集。 地理范围:数据涵盖多种语言,文本来源多样。... -
土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin
土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin 数据来源:互联网公开数据 标签:土耳其新闻,健康,数据集,文本分析,自然语言处理,新闻媒体,医疗健康,舆情分析 数据概述: 该数据集包含来自土耳其新闻媒体的健康相关文章,旨在为研究者提供一个用于文本分析和自然语言处理的资源。主要特征如下:... -
医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq
医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq 数据来源:互联网公开数据 标签:医疗问答,数据集,自然语言处理,医学研究,健康咨询,机器学习,信息检索,文本分析 数据概述:该数据集包含来自MedQuad项目的医疗问答数据,记录了患者与医疗专业人员之间的问答互动。主要特征如下:... -
政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23
政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23 数据来源:互联网公开数据 标签:文本分析,词汇频率,社交媒体,数据集,政治研究,自然语言处理,机器学习,论坛分析... -
特斯拉股票新闻相关性分析数据集-inkger
特斯拉股票新闻相关性分析数据集-inkger 数据来源:互联网公开数据 标签:特斯拉,股票,新闻,文本分析,情感分析,市场预测,机器学习,财经 数据概述: 该数据集包含与特斯拉股票相关的各种新闻报道和相关数据,旨在用于分析新闻内容与特斯拉股票价格之间的关系。主要特征如下:... -
情感分析与评论数据集
标题:情感分析与评论数据集 数据内容:该数据集包含两个主要字段,分别是“评论”和“情感”。其中,“评论”字段包含17,872种不同的值,代表了不同的用户评论内容;“情感”字段包含3种不同的值,表示评论的情感倾向(如正面、负面和中性)。 数据来源:互联网公开数据 数据用途: 1. 电子商务:可用于分析用户对产品或服务的评价,帮助企业优化产品和服务。 2.... -
情感分析与情绪分类数据集
标题:情感分析与情绪分类数据集 数据内容:本数据集包含了3289个不同的句子,每个句子都标注了相应的情绪和情感。情绪字段有6种不同的值,情感字段有2种不同的值。 数据来源:互联网公开数据... -
怪奇物语剧本对白数据集-sujaykapadnis
怪奇物语剧本对白数据集-sujaykapadnis 数据来源:互联网公开数据 标签:怪奇物语,Netflix,剧本,对白,影视,美剧,科幻,恐怖,剧情,时间序列,文本分析 数据概述:... -
诗歌-议论文及散文文本数据集-huosiyuan
诗歌-议论文及散文文本数据集-huosiyuan 数据来源:互联网公开数据 标签:诗歌,议论文,散文,文本分析,自然语言处理,写作风格,文本分类,教育 数据概述:... -
网络攻击URL识别数据集URL-AttackIdentificationDataset-natasa213
网络攻击URL识别数据集URL-AttackIdentificationDataset-natasa213 数据来源:互联网公开数据 标签:网络安全,数据集,机器学习,网络攻击,URL分类,文本分析,恶意软件,数据挖掘 数据概述: 该数据集专注于网络攻击中URL的识别与分类,记录了各种URL特征及其对应的攻击类型。主要特征如下:... -
聊天用语数据集ChatSlangDataset-muhammadbilal6305
聊天用语数据集ChatSlangDataset-muhammadbilal6305 数据来源:互联网公开数据 标签:聊天用语,社交媒体,数据集,自然语言处理,机器学习,文本分析,语言学,沟通研究 数据概述:该数据集包含来自社交媒体平台的聊天用语数据,记录了人们在聊天中使用的非正式语言,缩写和俚语。主要特征如下:... -
维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez
维基百科电影剧情摘要数据集Wiki-PlotsDataset-marcosmartinez 数据来源:互联网公开数据 标签:电影,剧情,数据集,文本分析,自然语言处理,信息检索,机器学习,电影研究 数据概述: 该数据集包含来自维基百科的电影剧情摘要数据,记录了大量电影的剧情概要信息。主要特征如下:...