找到11,747个数据集

标签: 自然语言处理

过滤结果
  • 新闻分类数据集NewsCategoryDataset-aishwaryamathala

    2025年4月24日   

    新闻分类数据集NewsCategoryDataset-aishwaryamathala 数据来源:互联网公开数据 标签:新闻分类,数据集,机器学习,自然语言处理,文本分析,信息检索,媒体研究,文本挖掘 数据概述:该数据集包含来自多个新闻来源的新闻文章,记录了不同类别的新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 语言识别数据集LanguageDetectorDataset-meet07824

    2025年4月24日   

    语言识别数据集LanguageDetectorDataset-meet07824 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,人工智能,数据分析 数据概述: 该数据集包含来自公开来源的语言识别数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:...
    packageimg
  • Airbnb评论情感分析数据集AirbnbVaderCleanedDataset-aamisha

    2025年4月24日   

    Airbnb评论情感分析数据集AirbnbVaderCleanedDataset-aamisha 数据来源:互联网公开数据 标签:Airbnb,情感分析,数据集,自然语言处理,文本挖掘,机器学习,评论分析,旅游 数据概述: 该数据集包含了来自 Airbnb 平台的房源评论数据,并经过了 VADER...
    packageimg
  • 电影评论情感分析数据集IMDBMoviesReviewDatasetforSentimentAnalysis-muhammadumairab

    2025年4月24日   

    电影评论情感分析数据集IMDBMoviesReviewDatasetforSentimentAnalysis-muhammadumairab 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电影评论,深度学习,人工智能...
    packageimg
  • 假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn

    2025年4月24日   

    假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn 数据来源:互联网公开数据 标签:假新闻,新闻,文本分析,自然语言处理,机器学习,情感分析,信息检索,文本分类 数据概述: 该数据集来自假新闻挑战赛(Fake News Challenge,FNC-1),旨在促进假新闻的自动检测和识别。主要特征如下:...
    packageimg
  • Lacuna分类提交数据集LacunaClassificationSubmissionsDataset-phantom50

    2025年4月24日   

    Lacuna分类提交数据集LacunaClassificationSubmissionsDataset-phantom50 数据来源:互联网公开数据 标签:分类任务,机器学习,数据集,文本分析,自然语言处理,学术研究,数据科学,人工智能 数据概述: 该数据集包含来自Lacuna平台的分类任务提交数据,记录了用户对文本样本的分类结果。主要特征如下:...
    packageimg
  • 股票价格预测与孟加拉文本数据集StockPricePredictionfromBanglaTextsDataset-tarikulislamtamiti

    2025年4月24日   

    股票价格预测与孟加拉文本数据集StockPricePredictionfromBanglaTextsDataset-tarikulislamtamiti 数据来源:互联网公开数据 标签:股票价格,预测分析,文本挖掘,孟加拉语,自然语言处理,机器学习,金融科技,数据集 数据概述:...
    packageimg
  • BBC新闻数据集BBCNewsDataset-waqarahmed163

    2025年4月24日   

    BBC新闻数据集BBCNewsDataset-waqarahmed163 数据来源:互联网公开数据 标签:BBC新闻,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息提取,文本挖掘 数据概述:该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13

    2025年4月24日   

    纽约租赁房产咨询数据集NewYorkRentalListingEnquiriesDataset-diwas13 数据来源:互联网公开数据 标签:房地产,租赁,数据集,咨询,自然语言处理,机器学习,文本分析,纽约 数据概述: 该数据集包含来自纽约租赁房产的咨询数据,记录了租房者与房产经纪人之间的互动信息。主要特征如下:...
    packageimg
  • Netflix西班牙语影评数据集NetflixSpanishMovieandSeriesReviewsDataset-haroldsrivera

    2025年4月24日   

    Netflix西班牙语影评数据集NetflixSpanishMovieandSeriesReviewsDataset-haroldsrivera 数据来源:互联网公开数据 标签:影视评论,数据集,情感分析,自然语言处理,机器学习,娱乐行业,文本挖掘,用户反馈 数据概述:...
    packageimg
  • 电影类型预测数据集-abhikdhar

    2025年4月24日   

    电影类型预测数据集-abhikdhar 数据来源:互联网公开数据 标签:电影,类型,预测,数据集,机器学习,自然语言处理,文本分析,娱乐,影评 数据概述: 该数据集包含电影相关的文本数据,旨在用于电影类型的预测任务。主要特征如下: 时间跨度:数据涵盖了不同年份上映的电影。 地理范围:数据主要来源于全球范围内的电影。...
    packageimg
  • 推文训练数据集Tweets-TrainDataset-priyankacheruku

    2025年4月24日   

    推文训练数据集Tweets-TrainDataset-priyankacheruku 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的文本内容和相关情感标签。主要特征如下:...
    packageimg
  • 数据2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh

    2025年4月24日   

    2025大规模多语言模型基准MMLM2025真实标注数据集MMLM2025GroundTruthDataset-tononnh 数据来源:互联网公开数据 标签:多语言模型,自然语言处理,数据集,机器学习,文本标注,基准测试,人工智能,语言技术 数据概述: 该数据集由2025年大规模多语言模型基准(MMLM...
    packageimg
  • 讯飞农业领域数据集-xuyatian

    2025年4月24日   

    讯飞农业领域数据集-xuyatian 数据来源:互联网公开数据 标签:农业,数据集,自然语言处理,人工智能,文本分析,农业科技,信息抽取,命名实体识别 数据概述:该数据集包含来自讯飞公开的农业领域相关数据,涵盖了农业领域的技术文档,新闻报道,专家访谈,学术论文等多种文本类型。主要特征如下:...
    packageimg
  • 孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse

    2025年4月24日   

    孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,孟加拉语,文本分类,机器学习,情感识别,文本挖掘 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务,旨在识别和分类文本中的情感倾向。主要特征如下:...
    packageimg
  • Python问题与答案数据集PythonQuestionandAnswerDataset-suhawni

    2025年4月24日   

    Python问题与答案数据集PythonQuestionandAnswerDataset-suhawni 数据来源:互联网公开数据 标签:编程,数据集,Python,问答系统,自然语言处理,教育技术,机器学习,技术支持 数据概述: 该数据集包含来自互联网的Python编程相关的问答数据,记录了用户提出的问题及其对应的答案。主要特征如下:...
    packageimg
  • H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej

    2025年4月24日   

    H-M集团产品文章数据集H-MGroupProductArticleDataset-ayushkumarkej 数据来源:互联网公开数据 标签:时尚,零售,产品,文章,数据集,文本分析,自然语言处理,推荐系统 数据概述: 该数据集包含 H&M 集团的产品文章数据,记录了 H&M 集团发布的关于服装和其他产品的文章信息。主要特征如下:...
    packageimg
  • 股票新闻情绪分析数据集-ahmedashrafahmed

    2025年4月24日   

    股票新闻情绪分析数据集-ahmedashrafahmed 数据来源:互联网公开数据 标签:股票,新闻,情绪分析,自然语言处理,金融,文本挖掘,机器学习,投资 数据概述:该数据集包含来自互联网的股票新闻数据,记录了新闻标题,发布时间,新闻内容以及相应的情绪评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 姓名性别数据集Name-GenderDataset-shivanshpandeys

    2025年4月24日   

    姓名性别数据集Name-GenderDataset-shivanshpandeys 数据来源:互联网公开数据 标签:姓名分析,性别识别,数据集,文本处理,机器学习,自然语言处理,人口统计,数据分析 数据概述: 该数据集包含来自公开来源的姓名和性别数据,记录了不同姓名对应的性别信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,涵盖历史和现代姓名。...
    packageimg
  • 基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873

    2025年4月24日   

    基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,语言模型,人工智能,文本生成,情感分析 数据概述: 该数据集由基因模型优化项目提供,主要记录了微型聊天机器人在不同对话场景下的交互数据。主要特征如下:...
    packageimg