-
有声书评论情感分析数据集AudiobookDataCleanedDataset-shoaibattankhan
有声书评论情感分析数据集AudiobookDataCleanedDataset-shoaibattankhan 数据来源:互联网公开数据 标签:有声书,评论,情感分析,自然语言处理,数据集,文本分析,机器学习,情感识别 数据概述: 该数据集包含有声书相关的评论数据,旨在用于情感分析和文本挖掘任务。主要特征如下:... -
TMS聊天机器人试用数据集-ananyaroy1011
TMS聊天机器人试用数据集-ananyaroy1011 数据来源:互联网公开数据 标签:聊天机器人,对话数据,自然语言处理,用户体验,人工智能,文本分析,机器学习,对话系统 数据概述: 该数据集包含由 TMS(此处假设为一家公司)提供的聊天机器人试用期间收集的对话数据,记录了用户与聊天机器人之间的交互信息。主要特征如下: 时间跨度:... -
Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit
Quora问题与回答数据集QuoraQuestionandAnswerDataset-gauravduttakiit 数据来源:互联网公开数据 标签:问答数据,自然语言处理,数据集,文本分析,机器学习,信息检索,知识图谱,社区互动 数据概述: 该数据集包含来自Quora平台的用户提问及回答数据,记录了平台上的问答互动内容。主要特征如下:... -
IMDB电影评论情感分析数据集IMDBMoviesSentimentDataset-hrishikeshpable
IMDB电影评论情感分析数据集IMDBMoviesSentimentDataset-hrishikeshpable 数据来源:互联网公开数据 标签:情感分析,电影评论,数据集,自然语言处理,机器学习,文本分析,数据挖掘,AI应用 数据概述: 该数据集包含来自IMDB(互联网电影数据库)的电影评论数据,记录了观众对电影的主观评价和情感倾向。主要特征如下:... -
独特推文数据集UniqueTweetsDataset-wenxindong
独特推文数据集UniqueTweetsDataset-wenxindong 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,自然语言处理,机器学习,信息挖掘,舆情分析,网络传播 数据概述: 该数据集包含来自社交媒体平台推文的独特内容,记录了用户的原创推文及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
波士顿咨询公司BCG人工审核清洗数据集BCGManuallyReviewed-CleanedDataset-didizlatkova
波士顿咨询公司BCG人工审核清洗数据集BCGManuallyReviewed-CleanedDataset-didizlatkova 数据来源:互联网公开数据 标签:商业咨询,数据集,文本分析,自然语言处理,数据清洗,人工审核,市场调研,客户反馈 数据概述:... -
印度姓名数据集SixtyThousandUniqueIndianNamesDataset-surajpratap
印度姓名数据集SixtyThousandUniqueIndianNamesDataset-surajpratap 数据来源:互联网公开数据 标签:印度姓名,数据集,文化研究,文本分析,语言学,人口统计,机器学习,数据科学 数据概述:该数据集包含来自互联网的6万个独特的印度姓名数据,记录了不同地区和文化背景下的印度人姓名。主要特征如下:... -
航空公司推文情感分析数据集SentimentAnalysisAirlineTweetsDataset-aspnet222
航空公司推文情感分析数据集SentimentAnalysisAirlineTweetsDataset-aspnet222 数据来源:互联网公开数据 标签:情感分析,航空公司,社交媒体,数据集,文本分析,机器学习,自然语言处理,客户服务 数据概述: 该数据集包含来自航空公司的推文数据,记录了用户对航空服务的情感反馈。主要特征如下:... -
汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki
汉字音译与注音数据集KanbunMerged1213Dataset-takuromochiduki 数据来源:互联网公开数据 标签:汉字注音,音译数据,历史文献,语言研究,数据集,汉语语言学,古籍数字化,文本分析 数据概述: 该数据集包含源自历史文献的汉字音译与注音数据,记录了汉字在不同历史时期的读音标注和音译信息。主要特征如下:... -
金融自然语言处理数据集FinnLPDatav2-金融自然语言处理数据集-coder2303
金融自然语言处理数据集FinnLPDatav2-金融自然语言处理数据集-coder2303 数据来源:互联网公开数据 标签:金融自然语言处理,数据集,文本分析,机器学习,自然语言处理,金融分析,情绪分析,文本挖掘 数据概述:... -
数据2024年Airbnb房源信息综合数据集-danieldvok280
2024年Airbnb房源信息综合数据集-danieldvok280 数据来源:互联网公开数据 标签:Airbnb,房源数据,租赁市场,地理信息,文本分析,机器学习,市场分析,旅游 数据概述:该数据集包含来自Airbnb平台的房源信息,记录了全球范围内Airbnb房源的详细数据。主要特征如下: 时间跨度:数据记录的时间范围为2024年。... -
大规模通用文本数据集LLM-Text-Data-abramova
大规模通用文本数据集LLM-Text-Data-abramova 数据来源:互联网公开数据 标签:文本数据,自然语言处理,大型语言模型,数据集,文本分析,机器学习,数据挖掘,通用领域 数据概述:该数据集包含了大规模的通用文本数据,旨在支持大型语言模型(LLM)的训练,评估和研究。主要特征如下:... -
推特私信数据集TwitterDMDataset-jiayu991011
推特私信数据集TwitterDMDataset-jiayu991011 数据来源:互联网公开数据 标签:推特,私信,社交媒体,自然语言处理,文本分析,情感分析,数据集,用户行为 数据概述: 该数据集包含来自推特(Twitter)的私信数据,记录了用户之间的私信内容和相关信息。主要特征如下:... -
莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845
莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845 数据来源:互联网公开数据 标签:莱特币,自然语言处理,数据集,文本分析,金融科技,加密货币,情感分析,机器学习 数据概述:... -
网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji
网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji 数据来源:互联网公开数据 标签:网络欺凌,数据集,社交媒体,文本分析,自然语言处理,情感分析,欺凌检测,社会学 数据概述: 该数据集包含来自社交媒体平台的网络欺凌相关数据,记录了用户在网络上遭受欺凌的事件信息。主要特征如下:... -
短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22
短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22 数据来源:互联网公开数据 标签:文本分析,自组织映射,数据集,自然语言处理,机器学习,情感分析,主题建模,数据可视化 数据概述:... -
阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli
阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli 数据来源:互联网公开数据 标签:新闻,阿塞拜疆语,数据集,自然语言处理,文本分析,机器学习,新闻挖掘,语言研究 数据概述: 该数据集包含来自阿塞拜疆当地新闻网站Ayna AZ的新闻文章,记录了近年来的新闻内容。主要特征如下:... -
体育新闻数据集2010-2023年数据集-newsdataio
体育新闻数据集2010-2023年数据集-newsdataio 数据来源:互联网公开数据 标签:体育新闻,数据集,文本分析,自然语言处理,机器学习,新闻学,媒体报道,体育事件 数据概述: 该数据集包含2010年至2023年的体育新闻数据,涵盖了全球主要体育赛事和运动员的新闻报道。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford
葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford 数据来源:互联网公开数据 标签:葡萄牙语,词频,语言学,自然语言处理,数据集,文本分析,语言学习,词汇研究 数据概述:... -
泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey
泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey 数据来源:互联网公开数据 标签:泰米尔语,短篇故事,机器阅读理解,自然语言处理,数据集,文本分析,语言学,人工智能 数据概述: 该数据集包含泰米尔语短篇故事数据,旨在用于机器阅读理解(MRC)任务。主要特征如下:...