数据集 - 海数据

有声书评论情感分析数据集AudiobookDataCleanedDataset-shoaibattankhan

2025年4月26日

有声书评论情感分析数据集AudiobookDataCleanedDataset-shoaibattankhan 数据来源：互联网公开数据标签：有声书，评论，情感分析，自然语言处理，数据集，文本分析，机器学习，情感识别数据概述：该数据集包含有声书相关的评论数据，旨在用于情感分析和文本挖掘任务。主要特征如下：...

ZIP

TMS聊天机器人试用数据集-ananyaroy1011

2025年4月26日

TMS聊天机器人试用数据集-ananyaroy1011 数据来源：互联网公开数据标签：聊天机器人，对话数据，自然语言处理，用户体验，人工智能，文本分析，机器学习，对话系统数据概述：该数据集包含由 TMS（此处假设为一家公司）提供的聊天机器人试用期间收集的对话数据，记录了用户与聊天机器人之间的交互信息。主要特征如下：时间跨度：...

ZIP

Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit

2025年4月26日

Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit 数据来源：互联网公开数据标签：问答数据，自然语言处理，数据集，文本分析，机器学习，信息检索，知识图谱，社区互动数据概述：该数据集包含来自Quora平台的用户提问及回答数据，记录了平台上的问答互动内容。主要特征如下：...

ZIP

IMDB电影评论情感分析数据集IMDBMoviesSentimentDataset-hrishikeshpable

2025年4月26日

IMDB电影评论情感分析数据集IMDBMoviesSentimentDataset-hrishikeshpable 数据来源：互联网公开数据标签：情感分析，电影评论，数据集，自然语言处理，机器学习，文本分析，数据挖掘，AI应用数据概述：该数据集包含来自IMDB（互联网电影数据库）的电影评论数据，记录了观众对电影的主观评价和情感倾向。主要特征如下：...

ZIP

独特推文数据集UniqueTweetsDataset-wenxindong

2025年4月26日

独特推文数据集UniqueTweetsDataset-wenxindong 数据来源：互联网公开数据标签：社交媒体，数据集，文本分析，自然语言处理，机器学习，信息挖掘，舆情分析，网络传播数据概述：该数据集包含来自社交媒体平台推文的独特内容，记录了用户的原创推文及其相关信息。主要特征如下：时间跨度：数据记录的时间范围从2010年到2022年。...

ZIP

波士顿咨询公司BCG人工审核清洗数据集BCGManuallyReviewed-CleanedDataset-didizlatkova

2025年4月26日

波士顿咨询公司BCG人工审核清洗数据集BCGManuallyReviewed-CleanedDataset-didizlatkova 数据来源：互联网公开数据标签：商业咨询，数据集，文本分析，自然语言处理，数据清洗，人工审核，市场调研，客户反馈数据概述：...

ZIP

印度姓名数据集SixtyThousandUniqueIndianNamesDataset-surajpratap

2025年4月26日

印度姓名数据集SixtyThousandUniqueIndianNamesDataset-surajpratap 数据来源：互联网公开数据标签：印度姓名，数据集，文化研究，文本分析，语言学，人口统计，机器学习，数据科学数据概述：该数据集包含来自互联网的6万个独特的印度姓名数据，记录了不同地区和文化背景下的印度人姓名。主要特征如下：...

ZIP

航空公司推文情感分析数据集SentimentAnalysisAirlineTweetsDataset-aspnet222

2025年4月26日

航空公司推文情感分析数据集SentimentAnalysisAirlineTweetsDataset-aspnet222 数据来源：互联网公开数据标签：情感分析，航空公司，社交媒体，数据集，文本分析，机器学习，自然语言处理，客户服务数据概述：该数据集包含来自航空公司的推文数据，记录了用户对航空服务的情感反馈。主要特征如下：...

ZIP

汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki

2025年4月26日

汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki 数据来源：互联网公开数据标签：汉字注音，音译数据，历史文献，语言研究，数据集，汉语语言学，古籍数字化，文本分析数据概述：该数据集包含源自历史文献的汉字音译与注音数据，记录了汉字在不同历史时期的读音标注和音译信息。主要特征如下：...

ZIP

金融自然语言处理数据集FinnLPDatav2-金融自然语言处理数据集-coder2303

2025年4月26日

金融自然语言处理数据集FinnLPDatav2-金融自然语言处理数据集-coder2303 数据来源：互联网公开数据标签：金融自然语言处理，数据集，文本分析，机器学习，自然语言处理，金融分析，情绪分析，文本挖掘数据概述：...

ZIP

数据2024年Airbnb房源信息综合数据集-danieldvok280

2025年4月26日

2024年Airbnb房源信息综合数据集-danieldvok280 数据来源：互联网公开数据标签：Airbnb，房源数据，租赁市场，地理信息，文本分析，机器学习，市场分析，旅游数据概述：该数据集包含来自Airbnb平台的房源信息，记录了全球范围内Airbnb房源的详细数据。主要特征如下：时间跨度：数据记录的时间范围为2024年。...

ZIP

大规模通用文本数据集LLM-Text-Data-abramova

2025年4月26日

大规模通用文本数据集LLM-Text-Data-abramova 数据来源：互联网公开数据标签：文本数据，自然语言处理，大型语言模型，数据集，文本分析，机器学习，数据挖掘，通用领域数据概述：该数据集包含了大规模的通用文本数据，旨在支持大型语言模型（LLM）的训练，评估和研究。主要特征如下：...

ZIP

推特私信数据集TwitterDMDataset-jiayu991011

2025年4月26日

推特私信数据集TwitterDMDataset-jiayu991011 数据来源：互联网公开数据标签：推特，私信，社交媒体，自然语言处理，文本分析，情感分析，数据集，用户行为数据概述：该数据集包含来自推特（Twitter）的私信数据，记录了用户之间的私信内容和相关信息。主要特征如下：...

ZIP

莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845

2025年4月26日

莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845 数据来源：互联网公开数据标签：莱特币，自然语言处理，数据集，文本分析，金融科技，加密货币，情感分析，机器学习数据概述：...

ZIP

网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji

2025年4月26日

网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji 数据来源：互联网公开数据标签：网络欺凌，数据集，社交媒体，文本分析，自然语言处理，情感分析，欺凌检测，社会学数据概述：该数据集包含来自社交媒体平台的网络欺凌相关数据，记录了用户在网络上遭受欺凌的事件信息。主要特征如下：...

ZIP

短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22

2025年4月26日

短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22 数据来源：互联网公开数据标签：文本分析，自组织映射，数据集，自然语言处理，机器学习，情感分析，主题建模，数据可视化数据概述：...

ZIP

阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli

2025年4月26日

阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli 数据来源：互联网公开数据标签：新闻，阿塞拜疆语，数据集，自然语言处理，文本分析，机器学习，新闻挖掘，语言研究数据概述：该数据集包含来自阿塞拜疆当地新闻网站Ayna AZ的新闻文章，记录了近年来的新闻内容。主要特征如下：...

ZIP

体育新闻数据集2010-2023年数据集-newsdataio

2025年4月26日

体育新闻数据集2010-2023年数据集-newsdataio 数据来源：互联网公开数据标签：体育新闻，数据集，文本分析，自然语言处理，机器学习，新闻学，媒体报道，体育事件数据概述：该数据集包含2010年至2023年的体育新闻数据，涵盖了全球主要体育赛事和运动员的新闻报道。主要特征如下：时间跨度：数据记录的时间范围从2010年到2023年。...

ZIP

葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford

2025年4月26日

葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford 数据来源：互联网公开数据标签：葡萄牙语，词频，语言学，自然语言处理，数据集，文本分析，语言学习，词汇研究数据概述：...

ZIP

泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey

2025年4月26日

泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey 数据来源：互联网公开数据标签：泰米尔语，短篇故事，机器阅读理解，自然语言处理，数据集，文本分析，语言学，人工智能数据概述：该数据集包含泰米尔语短篇故事数据，旨在用于机器阅读理解（MRC）任务。主要特征如下：...

ZIP

找到5,744个数据集

注册成功！