数据集 - 海数据

土耳其餐厅评论情感分析数据集-2024-mertsengil

2025年4月23日

土耳其餐厅评论情感分析数据集-2024-mertsengil 数据来源：互联网公开数据标签：土耳其语,情感分析,方面级情感分析,餐厅评论,NLP,文本分析,机器学习,自然语言处理数据概述：...

ZIP

人类对话文本数据集HumanChatDataset-josepjuli

2025年4月23日

人类对话文本数据集HumanChatDataset-josepjuli 数据来源：互联网公开数据标签：人类对话，文本数据，自然语言处理，聊天记录，语言模型，机器学习，对话系统，文本分析数据概述：该数据集包含来自互联网的大量人类对话文本，记录了不同场景下的对话记录。主要特征如下：时间跨度：数据记录的时间范围从2010年到2023年。...

ZIP

文本预处理与词形还原训练数据集-marouanesidali

2025年4月23日

文本预处理与词形还原训练数据集-marouanesidali 数据来源：互联网公开数据标签：文本预处理，词形还原，自然语言处理，机器学习，文本分析，数据集，NLP，训练数据数据概述：该数据集包含了经过预处理和词形还原的文本数据，主要用于训练和评估自然语言处理模型。主要特征如下：时间跨度：数据记录的时间范围不限，取决于原始文本数据集的构成。...

ZIP

垃圾邮件与正常邮件分类数据集SpamHamMessagesDataset-zenomarhoum

2025年4月23日

垃圾邮件与正常邮件分类数据集SpamHamMessagesDataset-zenomarhoum 数据来源：互联网公开数据标签：垃圾邮件，邮件分类，数据集，自然语言处理，机器学习，文本分析，数据挖掘，信息安全数据概述：该数据集包含来自公开邮件来源的邮件数据，记录了垃圾邮件和正常邮件的文本内容。主要特征如下：...

ZIP

情感分析通用数据集-shankhad

2025年4月23日

情感分析通用数据集-shankhad 数据来源：互联网公开数据标签：情感分析，文本分析，自然语言处理，数据集，机器学习，情感分类，情绪识别，文本挖掘，中文数据概述：该数据集包含来自多个来源的文本数据，用于情感分析任务，旨在识别文本中表达的情感倾向。主要特征如下：时间跨度：数据记录的时间跨度不固定，涵盖了不同时期和语境下的文本数据。...

ZIP

大规模语言模型增强数据集LLMAugmentedData-zhenghao97

2025年4月23日

大规模语言模型增强数据集LLMAugmentedData-zhenghao97 数据来源：互联网公开数据标签：语言模型，数据集，数据增强，自然语言处理，文本生成，机器学习，文本分析，人工智能数据概述：该数据集包含由大规模语言模型（LLM）生成和增强的文本数据，旨在用于训练和评估各种自然语言处理（NLP）模型。主要特征如下：...

ZIP

垃圾邮件检测测试数据集SpamTestDataset-maureenekwems

2025年4月23日

垃圾邮件检测测试数据集SpamTestDataset-maureenekwems 数据来源：互联网公开数据标签：垃圾邮件，数据集，邮件分类，机器学习，文本分析，分类算法，自然语言处理，网络安全数据概述：该数据集包含来自电子邮件服务的邮件数据，记录了不同邮件的分类标签（垃圾邮件或非垃圾邮件）。主要特征如下：时间跨度：...

ZIP

自然语言处理入门数据集NLPStartedDataset-liangyou

2025年4月23日

自然语言处理入门数据集NLPStartedDataset-liangyou 数据来源：互联网公开数据标签：自然语言处理，NLP，文本分析，机器学习，数据集，文本分类，情感分析，语言模型，入门数据概述：该数据集包含多个文本数据集，旨在帮助初学者入门自然语言处理领域。主要特征如下：...

ZIP

数据10000条样本语言识别数据集-amitverma2030

2025年4月23日

10000条样本语言识别数据集-amitverma2030 数据来源：互联网公开数据标签：语言识别，数据集，自然语言处理，文本分类，机器学习，文本分析，语言学，人工智能数据概述：该数据集包含10000条文本样本，用于语言识别任务。主要特征如下：时间跨度：数据无明确的时间范围，为静态数据集。地理范围：数据涵盖多种语言，文本来源多样。...

ZIP

土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin

2025年4月23日

土耳其新闻数据集-健康领域TurkishNewsDataset-Health-denizhanahin 数据来源：互联网公开数据标签：土耳其新闻，健康，数据集，文本分析，自然语言处理，新闻媒体，医疗健康，舆情分析数据概述：该数据集包含来自土耳其新闻媒体的健康相关文章，旨在为研究者提供一个用于文本分析和自然语言处理的资源。主要特征如下：...

ZIP

医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq

2025年4月23日

医疗问答处理数据集MedQuadProcessedDataset-yousouffarooq 数据来源：互联网公开数据标签：医疗问答，数据集，自然语言处理，医学研究，健康咨询，机器学习，信息检索，文本分析数据概述：该数据集包含来自MedQuad项目的医疗问答数据，记录了患者与医疗专业人员之间的问答互动。主要特征如下：...

ZIP

政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23

2025年4月23日

政治与非政治论坛词汇频率数据集WordFrequencyinPoliticalandNon-PoliticalSubredditDataset-anjay23 数据来源：互联网公开数据标签：文本分析，词汇频率，社交媒体，数据集，政治研究，自然语言处理，机器学习，论坛分析...

ZIP

特斯拉股票新闻相关性分析数据集-inkger

2025年4月23日

特斯拉股票新闻相关性分析数据集-inkger 数据来源：互联网公开数据标签：特斯拉，股票，新闻，文本分析，情感分析，市场预测，机器学习，财经数据概述：该数据集包含与特斯拉股票相关的各种新闻报道和相关数据，旨在用于分析新闻内容与特斯拉股票价格之间的关系。主要特征如下：...

ZIP

情感分析与评论数据集

2025年4月23日

标题：情感分析与评论数据集数据内容：该数据集包含两个主要字段，分别是“评论”和“情感”。其中，“评论”字段包含17,872种不同的值，代表了不同的用户评论内容；“情感”字段包含3种不同的值，表示评论的情感倾向（如正面、负面和中性）。数据来源：互联网公开数据数据用途： 1. 电子商务：可用于分析用户对产品或服务的评价，帮助企业优化产品和服务。 2....

CSV

情感分析与情绪分类数据集

2025年4月23日

标题：情感分析与情绪分类数据集数据内容：本数据集包含了3289个不同的句子，每个句子都标注了相应的情绪和情感。情绪字段有6种不同的值，情感字段有2种不同的值。数据来源：互联网公开数据...

CSV

怪奇物语剧本对白数据集-sujaykapadnis

2025年4月23日

怪奇物语剧本对白数据集-sujaykapadnis 数据来源：互联网公开数据标签：怪奇物语,Netflix,剧本,对白,影视,美剧,科幻,恐怖,剧情,时间序列,文本分析数据概述：...

ZIP

诗歌-议论文及散文文本数据集-huosiyuan

2025年4月23日

诗歌-议论文及散文文本数据集-huosiyuan 数据来源：互联网公开数据标签：诗歌,议论文,散文,文本分析,自然语言处理,写作风格,文本分类,教育数据概述：...

ZIP

网络攻击URL识别数据集URL-AttackIdentificationDataset-natasa213

2025年4月23日

网络攻击URL识别数据集URL-AttackIdentificationDataset-natasa213 数据来源：互联网公开数据标签：网络安全，数据集，机器学习，网络攻击，URL分类，文本分析，恶意软件，数据挖掘数据概述：该数据集专注于网络攻击中URL的识别与分类，记录了各种URL特征及其对应的攻击类型。主要特征如下：...

ZIP

聊天用语数据集ChatSlangDataset-muhammadbilal6305

2025年4月23日

聊天用语数据集ChatSlangDataset-muhammadbilal6305 数据来源：互联网公开数据标签：聊天用语，社交媒体，数据集，自然语言处理，机器学习，文本分析，语言学，沟通研究数据概述：该数据集包含来自社交媒体平台的聊天用语数据，记录了人们在聊天中使用的非正式语言，缩写和俚语。主要特征如下：...