-
互联网电影数据库IMDb电影评论数据集-endofnight17j03
互联网电影数据库IMDb电影评论数据集-endofnight17j03 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本挖掘,机器学习,数据集,影评,电影 数据概述:该数据集包含来自互联网电影数据库(IMDb)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:... -
推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta
推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,数据集,文本分析,机器学习,舆情分析 数据概述: 该数据集包含了从推特(Twitter)上抓取的推文数据,用于情感分析研究。主要特征如下:... -
单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1
单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1 数据来源:互联网公开数据 标签:自然语言处理,词频统计,数据集,文本分析,机器学习,语言模型,统计学,数据挖掘 数据概述: 该数据集包含来自多种文本来源的单字词频统计信息,记录了不同语言或文本中单个字的出现频率。主要特征如下:... -
情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98
情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,机器学习,情感分析,心理学,自然语言处理,文本分析,人工智能 数据概述: 该数据集包含来自多个来源的情绪识别数据,主要记录了人类情绪的文本表达,适用于情绪分类和情感分析等任务。主要特征如下:... -
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:... -
数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber
2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,反馈分析,机器学习,写作质量评估,语言模型,教育 数据概述:... -
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:... -
预处理输入数据数据集-isabbaggin
预处理输入数据数据集-isabbaggin 数据来源:互联网公开数据 标签:数据预处理,自然语言处理,数据集,文本分析,机器学习,数据清洗,文本挖掘,数据科学 数据概述:该数据集包含了用于数据预处理的各种输入数据样本,旨在帮助用户理解和实践数据清洗,转换和准备工作。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于输入数据的类型和来源。... -
电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001
电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001 数据来源:互联网公开数据 标签:电影,数据集,类型分类,机器学习,数据分析,娱乐行业,自然语言处理,文本分析 数据概述: 该数据集专注于电影类型的分类任务,记录了电影相关的详细信息。主要特征如下:... -
疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek
疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek 数据来源:互联网公开数据 标签:疫苗,推文,社交媒体,情绪分析,舆情分析,公共卫生,自然语言处理,数据挖掘 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了关于疫苗接种的讨论和观点。主要特征如下:... -
关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788
关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788 数据来源:互联网公开数据 标签:自然语言处理,URL匹配,数据集,关键词提取,文本分析,机器学习,信息检索,数据挖掘 数据概述:... -
集体意见垃圾邮件检测数据集-samygithub
集体意见垃圾邮件检测数据集-samygithub 数据来源:互联网公开数据 标签:垃圾邮件检测,集体意见,文本分析,自然语言处理,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集包含来自互联网的集体意见数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:... -
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源:互联网公开数据 标签:新闻文章,CAC40指数,金融市场,文本分析,自然语言处理,时间序列,情感分析,市场研究 数据概述:... -
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:... -
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,信息检索,计算机科学,数据分析,教育研究 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:... -
金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist
金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist 数据来源:互联网公开数据 标签:金融,新闻标题,数据集,文本分析,自然语言处理,机器学习,经济研究,新闻挖掘 数据概述: 该数据集包含来自多个金融新闻来源的标题数据,记录了金融领域的新闻标题及其相关信息。主要特征如下:... -
生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe
生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe 数据来源:互联网公开数据 标签:生物医学,情感分析,数据集,自然语言处理,文本挖掘,机器学习,健康信息,数据科学 数据概述: 该数据集包含来自生物医学领域的文本数据,记录了相关文献,新闻,评论等文本中的情感倾向。主要特征如下:... -
比特币推文数据集BTCTweetsDataset-senaada
比特币推文数据集BTCTweetsDataset-senaada 数据来源:互联网公开数据 标签:比特币,推文,数据集,社交媒体,自然语言处理,金融市场,投资分析,机器学习 数据概述:该数据集包含来自推特的比特币相关推文数据,记录了用户讨论比特币的言论和观点。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio
纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio 数据来源:互联网公开数据 标签:酒店,评论,情感分析,文本挖掘,自然语言处理,旅游,纽约,数据集 数据概述: 该数据集包含来自纽约酒店的评论数据,记录了用户对纽约各酒店的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含近期用户评论。... -
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam 数据来源:互联网公开数据 标签:文本识别,图像处理,数据集,自然语言处理,机器学习,计算机视觉,语言技术,多模态学习 数据概述: 该数据集包含高棉语文本与图像的标签数据,记录了高棉语文本在图像中的位置和内容。主要特征如下:...