找到11,768个数据集

标签: 自然语言处理

过滤结果
  • IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7

    2025年4月25日   

    IMDb电影评论预处理数据集IMDbMovieReviewsPreprocessedDataset-ayanwap7 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,文本分析,机器学习,情感分析,文本分类,人工智能 数据概述:该数据集包含来自IMDb网站的电影评论数据,已经进行了预处理,适用于情感分析,文本分类等任务。主要特征如下:...
    packageimg
  • 股票指数预测BERT模型新闻数据集DSEXNewsDatasetforForecastingDSEusingBERT-nilabrahman

    2025年4月25日   

    股票指数预测BERT模型新闻数据集DSEXNewsDatasetforForecastingDSEusingBERT-nilabrahman 数据来源:互联网公开数据 标签:股票市场,指数预测,数据集,自然语言处理,BERT模型,金融分析,机器学习,新闻分析 数据概述:...
    packageimg
  • BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban

    2025年4月25日   

    BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:...
    packageimg
  • BBC新闻训练集BBCNewsTrainingSet-subhashisb

    2025年4月25日   

    BBC新闻训练集BBCNewsTrainingSet-subhashisb 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分类,自然语言处理,机器学习,深度学习,文本分析,学术资源 数据概述:该数据集包含来自BBC新闻的训练数据,记录了不同类别的新闻文章。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 电影剧情标签数据集TaggedPlotMovieLensDataset-jquinteiro

    2025年4月25日   

    电影剧情标签数据集TaggedPlotMovieLensDataset-jquinteiro 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,标签分类,机器学习,自然语言处理,电影推荐,文本挖掘 数据概述: 该数据集包含来自MovieLens平台的电影剧情数据,记录了电影的剧情描述及其对应的标签。主要特征如下:...
    packageimg
  • 保险理赔分解格式化数据集ClaimDecompFormattedDataset-swethabalram2410

    2025年4月25日   

    保险理赔分解格式化数据集ClaimDecompFormattedDataset-swethabalram2410 数据来源:互联网公开数据 标签:保险业,理赔分析,数据集,金融科技,机器学习,数据分析,风险管理,自然语言处理 数据概述: 该数据集包含来自保险行业的理赔数据,记录了理赔申请的详细信息及其分解后的格式化内容。主要特征如下: 时间跨度:...
    packageimg
  • 雅虎新闻文章情感分析数据集YahooNewsArticleSentimentAnalysisDataset-rupeshsahoo123

    2025年4月25日   

    雅虎新闻文章情感分析数据集YahooNewsArticleSentimentAnalysisDataset-rupeshsahoo123 数据来源:互联网公开数据 标签:新闻,情感分析,数据集,自然语言处理,机器学习,文本挖掘,情感分类,舆情分析 数据概述: 该数据集包含来自雅虎新闻的文章和对应的情感标签,用于情感分析任务。主要特征如下:...
    packageimg
  • 标注数据集AnnotatedDataDataset-krishaborana

    2025年4月25日   

    标注数据集AnnotatedDataDataset-krishaborana 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,人工智能,数据科学,自然语言处理,图像识别,数据增强 数据概述: 该数据集包含经过人工或自动方式标注的数据,记录了各类数据样本及其对应的标签或注释信息。主要特征如下:...
    packageimg
  • 文章元数据数据集ArticleMeta-dataDataset-gautamsandeep

    2025年4月25日   

    文章元数据数据集ArticleMeta-dataDataset-gautamsandeep 数据来源:互联网公开数据 标签:元数据,数据集,信息检索,文本分析,自然语言处理,学术研究,知识发现,数据挖掘 数据概述:该数据集包含来自学术文章的元数据,记录了文章的各种信息,如标题,摘要,作者,关键词,出版日期,期刊信息等。主要特征如下:...
    packageimg
  • 文本转国际音标训练集TexttoIPAMappingTrainset-jakir57

    2025年4月25日   

    文本转国际音标训练集TexttoIPAMappingTrainset-jakir57 数据来源:互联网公开数据 标签:文本转音标,数据集,语音识别,自然语言处理,机器学习,语言学,音标转换,人工智能 数据概述:...
    packageimg
  • 法官判决命中数据集JudgeHitData-jidbro1

    2025年4月25日   

    法官判决命中数据集JudgeHitData-jidbro1 数据来源:互联网公开数据 标签:司法,判决,数据集,机器学习,法律,文本分析,自然语言处理,刑事案件 数据概述: 该数据集包含法官判决相关数据,旨在用于研究判决结果预测,法律文本分析等任务。主要特征如下: 时间跨度: 数据记录的时间范围从[起始年份]到[结束年份],例如2010年至2020年。...
    packageimg
  • 社交平台评论分类均衡数据集JigsawClassesBalancedDataset-linshokaku

    2025年4月25日   

    社交平台评论分类均衡数据集JigsawClassesBalancedDataset-linshokaku 数据来源:互联网公开数据 标签:社交平台,评论分类,数据集,机器学习,自然语言处理,文本分析,情感分析,不平衡数据处理 数据概述:该数据集包含来自社交平台的评论数据,旨在用于情感和主题分类任务。主要特征如下:...
    packageimg
  • UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti

    2025年4月25日   

    UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,情感分析,机器翻译,机器学习,人工智能,文本挖掘 数据概述: 该数据集包含来自UnivAI黑客松活动的数据,记录了参赛者在活动中生成和处理的文本数据。主要特征如下:...
    packageimg
  • 情感分析数据集SentimentAnalysisDataset-mohankjha

    2025年4月25日   

    情感分析数据集SentimentAnalysisDataset-mohankjha 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,数据挖掘,人工智能,文本情感 数据概述: 该数据集包含来自互联网公开来源的文本数据,记录了不同文本内容的情感倾向。主要特征如下: 时间跨度:数据记录的时间范围未明确指定。...
    packageimg
  • 谷歌应用商店应用评论数据集GooglePlayAppsReviewsDataset-madhavi11089

    2025年4月25日   

    谷歌应用商店应用评论数据集GooglePlayAppsReviewsDataset-madhavi11089 数据来源:互联网公开数据 标签:应用商店,评论分析,自然语言处理,情感分析,用户行为,数据集,移动应用,文本挖掘 数据概述: 该数据集包含了来自谷歌应用商店的应用评论数据,记录了用户对各种移动应用的评价和反馈。主要特征如下:...
    packageimg
  • 波斯语Farsi励志语录数据集MotivateQuotesFarsiPersianDataset-alijahani

    2025年4月25日   

    波斯语Farsi励志语录数据集MotivateQuotesFarsiPersianDataset-alijahani 数据来源:互联网公开数据 标签:励志语录,波斯语,数据集,语言学习,文化研究,文本分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 孟加拉语合成语音数据集-drhabib

    2025年4月25日   

    孟加拉语合成语音数据集-drhabib 数据来源:互联网公开数据 标签:语音合成,孟加拉语,语音识别,数据集,自然语言处理,机器学习,声学模型,语言技术 数据概述: 该数据集包含合成的孟加拉语语音数据,用于语音合成和相关研究。主要特征如下: 时间跨度:数据生成的时间范围为[具体时间,如2023年]。...
    packageimg
  • 凤凰Wright优秀律师第一季剧本数据集PhoenixWrightAceAttorneySeason1TranscriptDataset-gideonmckinlay

    2025年4月25日   

    凤凰Wright优秀律师第一季剧本数据集PhoenixWrightAceAttorneySeason1TranscriptDataset-gideonmckinlay 数据来源:互联网公开数据 标签:法律剧本,游戏数据,文本分析,自然语言处理,数据集,机器学习,法律研究,游戏设计 数据概述: 该数据集包含来自《凤凰 Wright...
    packageimg
  • 推特情感分析数据集TwitterSentimentAnalysisDataset-hngnguynhuy

    2025年4月25日   

    推特情感分析数据集TwitterSentimentAnalysisDataset-hngnguynhuy 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本分类,数据挖掘,情感挖掘 数据概述: 该数据集包含来自推特平台的大量文本数据,记录了用户在推特上发布的推文及其对应的情感标签。主要特征如下:...
    packageimg
  • BERT与SciBERT模型性能对比数据集BERTvsSciBERTPerformanceComparisonDataset-dannystax

    2025年4月25日   

    BERT与SciBERT模型性能对比数据集BERTvsSciBERTPerformanceComparisonDataset-dannystax 数据来源:互联网公开数据 标签:自然语言处理,机器学习,模型对比,BERT,SciBERT,深度学习,文本分类,学术研究 数据概述:...
    packageimg