数据集 - 海数据

简历数据分析数据集ResumeDataAnalysisDataset-someetsingh

2025年4月25日

简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源：互联网公开数据标签：简历，NLP，文本分析，数据集，自然语言处理，信息提取，机器学习，招聘数据概述：该数据集包含来自互联网的简历数据，记录了求职者的个人信息，教育背景，工作经历，技能等。主要特征如下：...

ZIP

数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber

2025年4月25日

2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源：互联网公开数据标签：文本分析，自然语言处理，数据集，反馈分析，机器学习，写作质量评估，语言模型，教育数据概述：...

ZIP

维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1

2025年4月25日

维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源：互联网公开数据标签：科学知识，维基百科，数据集，自然语言处理，文本分析，教育研究，信息检索，数据挖掘数据概述：该数据集包含来自维基百科的科学主题条目数据，记录了维基百科上关于科学领域的条目信息。主要特征如下：...

ZIP

预处理输入数据数据集-isabbaggin

2025年4月25日

预处理输入数据数据集-isabbaggin 数据来源：互联网公开数据标签：数据预处理，自然语言处理，数据集，文本分析，机器学习，数据清洗，文本挖掘，数据科学数据概述：该数据集包含了用于数据预处理的各种输入数据样本，旨在帮助用户理解和实践数据清洗，转换和准备工作。主要特征如下：时间跨度：数据记录的时间范围不固定，取决于输入数据的类型和来源。...

ZIP

电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001

2025年4月25日

电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001 数据来源：互联网公开数据标签：电影，数据集，类型分类，机器学习，数据分析，娱乐行业，自然语言处理，文本分析数据概述：该数据集专注于电影类型的分类任务，记录了电影相关的详细信息。主要特征如下：...

ZIP

疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek

2025年4月25日

疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek 数据来源：互联网公开数据标签：疫苗，推文，社交媒体，情绪分析，舆情分析，公共卫生，自然语言处理，数据挖掘数据概述：该数据集包含来自Twitter平台的推文数据，记录了关于疫苗接种的讨论和观点。主要特征如下：...

ZIP

关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788

2025年4月25日

关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788 数据来源：互联网公开数据标签：自然语言处理，URL匹配，数据集，关键词提取，文本分析，机器学习，信息检索，数据挖掘数据概述：...

ZIP

集体意见垃圾邮件检测数据集-samygithub

2025年4月25日

集体意见垃圾邮件检测数据集-samygithub 数据来源：互联网公开数据标签：垃圾邮件检测，集体意见，文本分析，自然语言处理，机器学习，情感分析，社交媒体，数据挖掘数据概述：该数据集包含来自互联网的集体意见数据，主要用于垃圾邮件检测任务。主要特征如下：时间跨度：数据记录的时间范围不明确，取决于数据来源。地理范围：...

ZIP

路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch

2025年4月24日

路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源：互联网公开数据标签：新闻文章，CAC40指数，金融市场，文本分析，自然语言处理，时间序列，情感分析，市场研究数据概述：...

ZIP

印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki

2025年4月24日

印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源：互联网公开数据标签：自然语言处理，印地语，数据集，语言模型，机器学习，文本生成，数据增强，多语言处理数据概述：该数据集包含用于印地语大语言模型训练和评估的数据，记录了印地语的文本生成任务所需的数据样本。主要特征如下：...

ZIP

文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina

2025年4月24日

文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源：互联网公开数据标签：文本分类，数据集，自然语言处理，机器学习，信息检索，计算机科学，数据分析，教育研究数据概述：该数据集包含来自多个来源的文章数据，记录了各类文章的文本内容和分类标签。主要特征如下：...

ZIP

金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist

2025年4月24日

金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist 数据来源：互联网公开数据标签：金融，新闻标题，数据集，文本分析，自然语言处理，机器学习，经济研究，新闻挖掘数据概述：该数据集包含来自多个金融新闻来源的标题数据，记录了金融领域的新闻标题及其相关信息。主要特征如下：...

ZIP

生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe

2025年4月24日

生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe 数据来源：互联网公开数据标签：生物医学，情感分析，数据集，自然语言处理，文本挖掘，机器学习，健康信息，数据科学数据概述：该数据集包含来自生物医学领域的文本数据，记录了相关文献，新闻，评论等文本中的情感倾向。主要特征如下：...

ZIP

比特币推文数据集BTCTweetsDataset-senaada

2025年4月24日

比特币推文数据集BTCTweetsDataset-senaada 数据来源：互联网公开数据标签：比特币，推文，数据集，社交媒体，自然语言处理，金融市场，投资分析，机器学习数据概述：该数据集包含来自推特的比特币相关推文数据，记录了用户讨论比特币的言论和观点。主要特征如下：时间跨度：数据记录的时间范围从2018年到2022年。...

ZIP

纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio

2025年4月24日

纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio 数据来源：互联网公开数据标签：酒店，评论，情感分析，文本挖掘，自然语言处理，旅游，纽约，数据集数据概述：该数据集包含来自纽约酒店的评论数据，记录了用户对纽约各酒店的评价和反馈。主要特征如下：时间跨度：数据记录的时间范围未知，但包含近期用户评论。...

ZIP

高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam

2025年4月24日

高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam 数据来源：互联网公开数据标签：文本识别，图像处理，数据集，自然语言处理，机器学习，计算机视觉，语言技术，多模态学习数据概述：该数据集包含高棉语文本与图像的标签数据，记录了高棉语文本在图像中的位置和内容。主要特征如下：...

ZIP

训练健康描述与数据数据集-sumeetbabar

2025年4月24日

训练健康描述与数据数据集-sumeetbabar 数据来源：互联网公开数据标签：健康，训练，描述，数据集，自然语言处理，文本分析，医学，健康管理数据概述：该数据集包含关于训练和健康描述的数据，记录了与训练相关的健康信息。主要特征如下：时间跨度：数据记录的时间范围不定，涵盖了不同时间段的训练和健康数据。...

ZIP

亚马逊与Goodreads图书评价数据集AmazonandGoodreadsBookReviewDataset-yessinbeyhan

2025年4月24日

亚马逊与Goodreads图书评价数据集AmazonandGoodreadsBookReviewDataset-yessinbeyhan 数据来源：互联网公开数据标签：图书评价，数据集，用户行为，情感分析，图书推荐，自然语言处理，电子商务，机器学习数据概述：...

ZIP

脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1

2025年4月24日

脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1 数据来源：互联网公开数据标签：脱口秀，喜剧，文本分析，自然语言处理，数据集，语言学，娱乐，表演艺术数据概述：该数据集包含了大量的脱口秀表演脚本，记录了不同喜剧演员的表演内容。主要特征如下：时间跨度：数据记录的时间范围不定，涵盖了不同年代的脱口秀表演。...

ZIP

人工智能对话数据集SiriusAIDataset-qacenn

2025年4月24日

人工智能对话数据集SiriusAIDataset-qacenn 数据来源：互联网公开数据标签：人工智能，对话系统，数据集，自然语言处理，机器学习，聊天机器人，用户交互，智能客服数据概述：该数据集包含来自Sirius AI的对话数据，记录了用户与AI助手之间的交互对话。主要特征如下：时间跨度：数据记录的时间范围从2020年到2023年。...

ZIP

找到11,992个数据集

注册成功！