找到11,792个数据集

标签: 自然语言处理

过滤结果
  • 魔戒电影数据分析数据集LordoftheRingsDataset-jaimeyao

    2025年4月26日   

    魔戒电影数据分析数据集LordoftheRingsDataset-jaimeyao 数据来源:互联网公开数据 标签:电影,数据分析,魔戒,文化研究,文本分析,人工智能,自然语言处理,影视研究 数据概述: 该数据集包含来自《魔戒》电影系列的数据,记录了该电影系列的详细信息。主要特征如下:...
    packageimg
  • 情绪方向识别数据集AngerDirectionRecognitionDataset-dianaspahieva

    2025年4月26日   

    情绪方向识别数据集AngerDirectionRecognitionDataset-dianaspahieva 数据来源:互联网公开数据 标签:情绪识别,数据集,自然语言处理,情感分析,机器学习,人工智能,文本分析,社会研究 数据概述:...
    packageimg
  • 自然语言到SQL转换数据集NL2SQL-himanshunayal

    2025年4月26日   

    自然语言到SQL转换数据集NL2SQL-himanshunayal 数据来源:互联网公开数据 标签:自然语言处理,数据库,SQL,数据集,文本理解,语义解析,问答系统,机器学习 数据概述: 该数据集包含1000个样本,用于自然语言到SQL(NL2SQL)任务,即通过自然语言描述来生成SQL查询语句。主要特征如下:...
    packageimg
  • 推特标签数据集LabelTweetsDataset-corinnedavidemakia

    2025年4月26日   

    推特标签数据集LabelTweetsDataset-corinnedavidemakia 数据来源:互联网公开数据 标签:推特,社交媒体,文本分析,情感分析,自然语言处理,数据集,机器学习,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的推文数据,并附带标签,用于文本分析和情感分析等任务。主要特征如下:...
    packageimg
  • 扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong

    2025年4月26日   

    扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong 数据来源:互联网公开数据 标签:数学竞赛,数据集,机器学习,自然语言处理,数学建模,问题解答,人工智能,文本分析 数据概述: 该数据集包含来自扎罗数学竞赛的题目和解答数据,用于支持数学问题解答,自然语言处理等任务。主要特征如下:...
    packageimg
  • 实体解析名称与公司数据集EntityResolutionNamevsCompanyDataset-mastmustu

    2025年4月26日   

    实体解析名称与公司数据集EntityResolutionNamevsCompanyDataset-mastmustu 数据来源:互联网公开数据 标签:实体解析,数据集,企业信息,机器学习,自然语言处理,数据匹配,商业智能,信息整合 数据概述: 该数据集包含来自公开企业信息平台的数据,记录了企业名称与企业实体之间的对应关系。主要特征如下:...
    packageimg
  • Jigsaw偏见检测数据集JigsawBiasDetectionDataset-peijinchen

    2025年4月26日   

    Jigsaw偏见检测数据集JigsawBiasDetectionDataset-peijinchen 数据来源:互联网公开数据 标签:自然语言处理,文本分析,偏见检测,数据集,机器学习,情感分析,社会科学,人工智能 数据概述: 该数据集由 Jigsaw 团队提供,旨在支持对在线评论中偏见和有害言论的检测与分析。主要特征如下:...
    packageimg
  • 自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta

    2025年4月26日   

    自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器学习,模型训练,语言模型,情感分析 数据概述: 该数据集包含来自NLP领域的多样化文本数据,旨在支持各种NLP任务,如文本分类,情感分析,机器翻译等。主要特征如下:...
    packageimg
  • 印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch

    2025年4月26日   

    印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch 数据来源:互联网公开数据 标签:新闻,印地语,数据集,文本分析,自然语言处理,机器学习,新闻分类,语言处理 数据概述: 该数据集包含来自BBC印地语新闻频道的新闻文章数据,记录了BBC印地语新闻的文本内容。主要特征如下:...
    packageimg
  • 情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri

    2025年4月26日   

    情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,BERT模型,机器学习,文本分类,深度学习,人工智能 数据概述: 该数据集专注于情感分析任务,基于BERT-...
    packageimg
  • EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92

    2025年4月26日   

    EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...
    packageimg
  • 土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin

    2025年4月26日   

    土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin 数据来源:互联网公开数据 标签:科技新闻,数据集,文本分析,自然语言处理,机器学习,信息提取,土耳其,新闻报道...
    packageimg
  • 披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho

    2025年4月26日   

    披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho 数据来源:互联网公开数据 标签:流行音乐,歌词分析,数据集,音乐研究,文本挖掘,自然语言处理,音乐历史,文化研究 数据概述: 该数据集包含来自披头士乐队(The...
    packageimg
  • 立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis

    2025年4月26日   

    立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis 数据来源:互联网公开数据 标签:金融新闻,文本分析,自然语言处理,立陶宛,数据集,情感分析,信息抽取,语言模型 数据概述: 该数据集包含了来自立陶宛金融新闻的文本数据,旨在用于金融领域相关的文本分析任务。主要特征如下: 时间跨度:...
    packageimg
  • 健康App评论数据集HealthAppsReviewDataset-faysal1998

    2025年4月26日   

    健康App评论数据集HealthAppsReviewDataset-faysal1998 数据来源:互联网公开数据 标签:健康App,评论,用户评价,自然语言处理,情感分析,移动健康,机器学习,App Store 数据概述: 该数据集包含来自App Store的健康App评论数据,记录了用户对不同健康类App的评价。主要特征如下:...
    packageimg
  • 中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777

    2025年4月26日   

    中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777 数据来源:互联网公开数据 标签:自然语言处理,词向量,关系抽取,数据集,PyTorch,深度学习,中文,大数据分析 数据概述:...
    packageimg
  • 印度政治剧帕塔尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren

    2025年4月26日   

    印度政治剧帕塔尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren 数据来源:互联网公开数据 标签:影视评论,数据集,情感分析,机器学习,文本挖掘,自然语言处理,印度电影,数据分析 数据概述: 该数据集包含来自IMDB网站的用户对印度政治剧《帕塔尔洛克》的评论数据,记录了观众对剧集的评价和反馈。主要特征如下:...
    packageimg
  • 样本问答数据集SampledQADataDataset-hritik619916

    2025年4月26日   

    样本问答数据集SampledQADataDataset-hritik619916 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,信息检索,文本分析,人工智能,数据挖掘 数据概述: 该数据集包含来自公开来源的问答对样本数据,记录了问题与对应答案的配对信息。主要特征如下:...
    packageimg
  • AI对齐领域人机交互质量评估数据集-HelpSteer

    2025年4月26日   

    AI对齐领域人机交互质量评估数据集-HelpSteer 数据来源:互联网公开数据 标签:AI对齐,人机交互,自然语言处理,数据集,Prompt,响应,评价,可信赖AI,机器学习 数据概述:...
    packageimg
  • GermEval18文本分类数据集-thedevastator

    2025年4月22日   

    GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:...
    packageimg