-
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:... -
数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber
2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,反馈分析,机器学习,写作质量评估,语言模型,教育 数据概述:... -
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:... -
预处理输入数据数据集-isabbaggin
预处理输入数据数据集-isabbaggin 数据来源:互联网公开数据 标签:数据预处理,自然语言处理,数据集,文本分析,机器学习,数据清洗,文本挖掘,数据科学 数据概述:该数据集包含了用于数据预处理的各种输入数据样本,旨在帮助用户理解和实践数据清洗,转换和准备工作。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于输入数据的类型和来源。... -
电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001
电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001 数据来源:互联网公开数据 标签:电影,数据集,类型分类,机器学习,数据分析,娱乐行业,自然语言处理,文本分析 数据概述: 该数据集专注于电影类型的分类任务,记录了电影相关的详细信息。主要特征如下:... -
疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek
疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek 数据来源:互联网公开数据 标签:疫苗,推文,社交媒体,情绪分析,舆情分析,公共卫生,自然语言处理,数据挖掘 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了关于疫苗接种的讨论和观点。主要特征如下:... -
关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788
关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788 数据来源:互联网公开数据 标签:自然语言处理,URL匹配,数据集,关键词提取,文本分析,机器学习,信息检索,数据挖掘 数据概述:... -
集体意见垃圾邮件检测数据集-samygithub
集体意见垃圾邮件检测数据集-samygithub 数据来源:互联网公开数据 标签:垃圾邮件检测,集体意见,文本分析,自然语言处理,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集包含来自互联网的集体意见数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:... -
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch
路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源:互联网公开数据 标签:新闻文章,CAC40指数,金融市场,文本分析,自然语言处理,时间序列,情感分析,市场研究 数据概述:... -
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:... -
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina
文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,信息检索,计算机科学,数据分析,教育研究 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:... -
金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist
金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist 数据来源:互联网公开数据 标签:金融,新闻标题,数据集,文本分析,自然语言处理,机器学习,经济研究,新闻挖掘 数据概述: 该数据集包含来自多个金融新闻来源的标题数据,记录了金融领域的新闻标题及其相关信息。主要特征如下:... -
生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe
生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe 数据来源:互联网公开数据 标签:生物医学,情感分析,数据集,自然语言处理,文本挖掘,机器学习,健康信息,数据科学 数据概述: 该数据集包含来自生物医学领域的文本数据,记录了相关文献,新闻,评论等文本中的情感倾向。主要特征如下:... -
比特币推文数据集BTCTweetsDataset-senaada
比特币推文数据集BTCTweetsDataset-senaada 数据来源:互联网公开数据 标签:比特币,推文,数据集,社交媒体,自然语言处理,金融市场,投资分析,机器学习 数据概述:该数据集包含来自推特的比特币相关推文数据,记录了用户讨论比特币的言论和观点。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio
纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio 数据来源:互联网公开数据 标签:酒店,评论,情感分析,文本挖掘,自然语言处理,旅游,纽约,数据集 数据概述: 该数据集包含来自纽约酒店的评论数据,记录了用户对纽约各酒店的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含近期用户评论。... -
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam
高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam 数据来源:互联网公开数据 标签:文本识别,图像处理,数据集,自然语言处理,机器学习,计算机视觉,语言技术,多模态学习 数据概述: 该数据集包含高棉语文本与图像的标签数据,记录了高棉语文本在图像中的位置和内容。主要特征如下:... -
训练健康描述与数据数据集-sumeetbabar
训练健康描述与数据数据集-sumeetbabar 数据来源:互联网公开数据 标签:健康,训练,描述,数据集,自然语言处理,文本分析,医学,健康管理 数据概述: 该数据集包含关于训练和健康描述的数据,记录了与训练相关的健康信息。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时间段的训练和健康数据。... -
亚马逊与Goodreads图书评价数据集AmazonandGoodreadsBookReviewDataset-yessinbeyhan
亚马逊与Goodreads图书评价数据集AmazonandGoodreadsBookReviewDataset-yessinbeyhan 数据来源:互联网公开数据 标签:图书评价,数据集,用户行为,情感分析,图书推荐,自然语言处理,电子商务,机器学习 数据概述:... -
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1 数据来源:互联网公开数据 标签:脱口秀,喜剧,文本分析,自然语言处理,数据集,语言学,娱乐,表演艺术 数据概述: 该数据集包含了大量的脱口秀表演脚本,记录了不同喜剧演员的表演内容。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同年代的脱口秀表演。... -
人工智能对话数据集SiriusAIDataset-qacenn
人工智能对话数据集SiriusAIDataset-qacenn 数据来源:互联网公开数据 标签:人工智能,对话系统,数据集,自然语言处理,机器学习,聊天机器人,用户交互,智能客服 数据概述:该数据集包含来自Sirius AI的对话数据,记录了用户与AI助手之间的交互对话。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...