找到11,761个数据集

标签: 自然语言处理

过滤结果
  • 互联网电影数据库IMDb电影评论数据集-endofnight17j03

    2025年4月25日   

    互联网电影数据库IMDb电影评论数据集-endofnight17j03 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本挖掘,机器学习,数据集,影评,电影 数据概述:该数据集包含来自互联网电影数据库(IMDb)的电影评论数据,记录了用户对电影的评价和评论内容。主要特征如下:...
    packageimg
  • 推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta

    2025年4月25日   

    推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,数据集,文本分析,机器学习,舆情分析 数据概述: 该数据集包含了从推特(Twitter)上抓取的推文数据,用于情感分析研究。主要特征如下:...
    packageimg
  • 单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1

    2025年4月25日   

    单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1 数据来源:互联网公开数据 标签:自然语言处理,词频统计,数据集,文本分析,机器学习,语言模型,统计学,数据挖掘 数据概述: 该数据集包含来自多种文本来源的单字词频统计信息,记录了不同语言或文本中单个字的出现频率。主要特征如下:...
    packageimg
  • 情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98

    2025年4月25日   

    情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,机器学习,情感分析,心理学,自然语言处理,文本分析,人工智能 数据概述: 该数据集包含来自多个来源的情绪识别数据,主要记录了人类情绪的文本表达,适用于情绪分类和情感分析等任务。主要特征如下:...
    packageimg
  • 简历数据分析数据集ResumeDataAnalysisDataset-someetsingh

    2025年4月25日   

    简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:...
    packageimg
  • 数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber

    2025年4月25日   

    2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,反馈分析,机器学习,写作质量评估,语言模型,教育 数据概述:...
    packageimg
  • 维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1

    2025年4月25日   

    维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:...
    packageimg
  • 预处理输入数据数据集-isabbaggin

    2025年4月25日   

    预处理输入数据数据集-isabbaggin 数据来源:互联网公开数据 标签:数据预处理,自然语言处理,数据集,文本分析,机器学习,数据清洗,文本挖掘,数据科学 数据概述:该数据集包含了用于数据预处理的各种输入数据样本,旨在帮助用户理解和实践数据清洗,转换和准备工作。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于输入数据的类型和来源。...
    packageimg
  • 电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001

    2025年4月25日   

    电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001 数据来源:互联网公开数据 标签:电影,数据集,类型分类,机器学习,数据分析,娱乐行业,自然语言处理,文本分析 数据概述: 该数据集专注于电影类型的分类任务,记录了电影相关的详细信息。主要特征如下:...
    packageimg
  • 疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek

    2025年4月25日   

    疫苗接种推文数据集ToVaccinateorNottoVaccinateTweetsDataset-hamditarek 数据来源:互联网公开数据 标签:疫苗,推文,社交媒体,情绪分析,舆情分析,公共卫生,自然语言处理,数据挖掘 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了关于疫苗接种的讨论和观点。主要特征如下:...
    packageimg
  • 关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788

    2025年4月25日   

    关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788 数据来源:互联网公开数据 标签:自然语言处理,URL匹配,数据集,关键词提取,文本分析,机器学习,信息检索,数据挖掘 数据概述:...
    packageimg
  • 集体意见垃圾邮件检测数据集-samygithub

    2025年4月25日   

    集体意见垃圾邮件检测数据集-samygithub 数据来源:互联网公开数据 标签:垃圾邮件检测,集体意见,文本分析,自然语言处理,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集包含来自互联网的集体意见数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:...
    packageimg
  • 路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch

    2025年4月24日   

    路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源:互联网公开数据 标签:新闻文章,CAC40指数,金融市场,文本分析,自然语言处理,时间序列,情感分析,市场研究 数据概述:...
    packageimg
  • 印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki

    2025年4月24日   

    印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:...
    packageimg
  • 文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina

    2025年4月24日   

    文章分类数据集ArticlesforClassificationDataset-anastasiyanoskina 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,信息检索,计算机科学,数据分析,教育研究 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:...
    packageimg
  • 金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist

    2025年4月24日   

    金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist 数据来源:互联网公开数据 标签:金融,新闻标题,数据集,文本分析,自然语言处理,机器学习,经济研究,新闻挖掘 数据概述: 该数据集包含来自多个金融新闻来源的标题数据,记录了金融领域的新闻标题及其相关信息。主要特征如下:...
    packageimg
  • 生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe

    2025年4月24日   

    生物医学文本情感分析数据集Bio-SentimentsDataset-kingajohnsjoe 数据来源:互联网公开数据 标签:生物医学,情感分析,数据集,自然语言处理,文本挖掘,机器学习,健康信息,数据科学 数据概述: 该数据集包含来自生物医学领域的文本数据,记录了相关文献,新闻,评论等文本中的情感倾向。主要特征如下:...
    packageimg
  • 比特币推文数据集BTCTweetsDataset-senaada

    2025年4月24日   

    比特币推文数据集BTCTweetsDataset-senaada 数据来源:互联网公开数据 标签:比特币,推文,数据集,社交媒体,自然语言处理,金融市场,投资分析,机器学习 数据概述:该数据集包含来自推特的比特币相关推文数据,记录了用户讨论比特币的言论和观点。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio

    2025年4月24日   

    纽约酒店评论数据集NewYorkHotelsReviewsDataset-gdberrio 数据来源:互联网公开数据 标签:酒店,评论,情感分析,文本挖掘,自然语言处理,旅游,纽约,数据集 数据概述: 该数据集包含来自纽约酒店的评论数据,记录了用户对纽约各酒店的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含近期用户评论。...
    packageimg
  • 高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam

    2025年4月24日   

    高棉语文本图像标签数据集KhmerTextImageLabelDataset-raychannudam 数据来源:互联网公开数据 标签:文本识别,图像处理,数据集,自然语言处理,机器学习,计算机视觉,语言技术,多模态学习 数据概述: 该数据集包含高棉语文本与图像的标签数据,记录了高棉语文本在图像中的位置和内容。主要特征如下:...
    packageimg