找到581个数据集

标签: NLP

过滤结果
  • 自然语言处理NLP职位描述数据集-koti4878m

    2025年5月30日   

    自然语言处理NLP职位描述数据集-koti4878m 数据来源:互联网公开数据 标签:自然语言处理,NLP,职位描述,文本分析,机器学习,招聘,数据挖掘,文本分类 数据概述:该数据集包含来自互联网的职位描述文本数据,主要记录了不同行业的职位描述信息。主要特征如下: 时间跨度:数据记录的时间范围跨度不定,取决于爬取时间与数据来源。...
    packageimg
  • 标题:文本标题提取数据集(Hasninasri Title Extraction Dataset)

    2025年5月30日   

    标题:文本标题提取数据集(Hasninasri Title Extraction Dataset) 数据来源:互联网公开数据 标签:文本分析,标题提取,自然语言处理,机器学习,文本挖掘,NLP,数据集,信息检索 数据概述: 该数据集由Hasninasri提供,旨在用于文本标题的提取和生成任务,包含大量的文本内容及其对应的标题。主要特征如下:...
    packageimg
  • 诗歌创作与分析数据集PoemsData-lisaameliewittmann

    2025年5月30日   

    诗歌创作与分析数据集PoemsData-lisaameliewittmann 数据来源:互联网公开数据 标签:诗歌,数据集,自然语言处理,文本分析,情感分析,文学研究,创作,NLP 数据概述: 该数据集包含了来自互联网的各类诗歌作品,旨在为诗歌创作与分析提供数据支持。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了从古代到现代的诗歌作品。...
    packageimg
  • Synnax数据集竞赛第二期数据集-sukrucildirr

    2025年5月29日   

    Synnax数据集竞赛第二期数据集-sukrucildirr 数据来源:互联网公开数据 标签:机器学习,数据集,自然语言处理,文本分类,情感分析,竞赛,中文文本,NLP 数据概述: 该数据集是 Synnax 数据集竞赛第二期提供的数据集,主要用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不详,但为竞赛提供,具有时效性。...
    packageimg
  • 阿拉伯语文本情感分析数据集-nanorfelixsam

    2025年5月29日   

    阿拉伯语文本情感分析数据集-nanorfelixsam 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,文本数据,自然语言处理,机器学习,NLP,语言学,情感分类 数据概述: 该数据集包含来自互联网的阿拉伯语文本数据,用于阿拉伯语文本情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期互联网上的阿拉伯语文本。...
    packageimg
  • 阿拉伯新闻文章标题生成数据集-oussamaseffai

    2025年5月29日   

    阿拉伯新闻文章标题生成数据集-oussamaseffai 数据来源:互联网公开数据 标签:自然语言处理,文本生成,阿拉伯语,标题生成,机器学习,新闻文章,语言模型,NLP 数据概述: 该数据集包含了阿拉伯语新闻文章及其对应的标题,用于训练和评估阿拉伯语新闻标题生成模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了近期的新闻文章。...
    packageimg
  • CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych

    2025年5月29日   

    CNN新闻摘要语料库Tokenized数据集-ivanzhytkevych 数据来源:互联网公开数据 标签:新闻摘要,文本摘要,自然语言处理,深度学习,机器翻译,数据集,文本分析,NLP 数据概述: 该数据集包含来自CNN新闻的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了新闻发布的时间段,具体时间范围未明确。...
    packageimg
  • 词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju

    2025年5月29日   

    词向量模型结果数据集Word2VecResultsDataset-tarunpaparaju 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,语义分析,向量空间,NLP 数据概述: 该数据集包含了使用Word2Vec模型训练得到的词向量结果,主要记录了词汇与其对应的向量表示。主要特征如下:...
    packageimg
  • 医学推文情感分析数据集Tweets-MedDataset-milanezeus

    2025年5月29日   

    医学推文情感分析数据集Tweets-MedDataset-milanezeus 数据来源:互联网公开数据 标签:医学,推文,情感分析,社交媒体,NLP,自然语言处理,情感识别,文本挖掘 数据概述: 该数据集包含来自Twitter的医学相关推文数据,记录了用户在社交媒体上对医疗健康话题的讨论和观点。主要特征如下:...
    packageimg
  • Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat

    2025年5月29日   

    Quora问题恶意内容检测数据集Jigsaw2020QuoraXEncodedYPseudoDataset-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,恶意内容检测,数据集,Quora,深度学习,情感分析,NLP 数据概述: 该数据集来自Jigsaw...
    packageimg
  • IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92

    2025年5月29日   

    IMDB电影评论情感分析数据集IMDBMovieReviewSentimentAnalysisDataset-pramodgupta92 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,数据集,文本挖掘,机器学习,情感分类,NLP 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 俄罗斯新闻文本情感分析数据集LentaTrainingDataDataset-andreykondakov

    2025年5月29日   

    俄罗斯新闻文本情感分析数据集LentaTrainingDataDataset-andreykondakov 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,新闻,俄语,NLP 数据概述: 该数据集包含来自俄罗斯新闻网站Lenta.ru的文本数据,用于情感分析任务。主要特征如下:...
    packageimg
  • Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificati...

    2025年5月29日   

    Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificationChallengeTrainDataset-shahules 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,毒性检测,评论分析,社交媒体,深度学习,NLP 数据概述:...
    packageimg
  • 大规模恶意评论检测数据集ToxicCommentClassificationChallenge-amankumar2002

    2025年5月29日   

    大规模恶意评论检测数据集ToxicCommentClassificationChallenge-amankumar2002 数据来源:互联网公开数据 标签:文本分类,自然语言处理,深度学习,恶意评论,情感分析,数据集,机器学习,NLP 数据概述:...
    packageimg
  • 语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001

    2025年5月29日   

    语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001 数据来源:互联网公开数据 标签:自然语言处理,NLP,推理,数据集,机器学习,文本分析,语言模型,人工智能 数据概述:...
    packageimg
  • 新闻文本情感分析数据集NewsTextSentimentAnalysisDataset-jehzi123

    2025年5月29日   

    新闻文本情感分析数据集NewsTextSentimentAnalysisDataset-jehzi123 数据来源:互联网公开数据 标签:新闻文本,情感分析,自然语言处理,数据集,机器学习,文本分类,舆情分析,NLP 数据概述: 该数据集包含了大量的新闻文本及其对应的情感标签,用于情感分析、文本分类等任务。主要特征如下:...
    packageimg
  • 土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat

    2025年5月28日   

    土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,土耳其语,数据集,文本分析,政治,机器学习,NLP 数据概述: 该数据集包含来自土耳其大国民议会(TBMM)的文本数据,用于命名实体识别(NER)任务。主要特征如下:...
    packageimg
  • NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview

    2025年5月28日   

    NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:...
    packageimg
  • 越南语句情感分析数据集-taitruong256

    2025年5月28日   

    越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。...
    packageimg
  • 恶意信息文本分类数据集-aniketgupta01

    2025年5月28日   

    恶意信息文本分类数据集-aniketgupta01 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,恶意信息,情感分析,数据集,NLP,深度学习 数据概述: 该数据集包含用于恶意信息文本分类的文本数据,旨在识别和区分文本中的恶意内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含了当前常见的网络用语和恶意表达方式。...
    packageimg