找到560个数据集

标签: NLP

过滤结果
  • 语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha

    2025年4月22日   

    语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha 数据来源:互联网公开数据 标签:诗歌,语言模型,NLP,文本生成,机器学习,教育,学习资源 数据概述: 本数据集包含100首诗歌,适用于语言模型的文本生成任务。数据集中的诗歌涵盖了不同的风格和主题,包括抒情诗、叙事诗和自由诗等,为训练语言模型提供了丰富的文本素材。...
    packageimg
  • BERT情感分析数据集-endofnight17j03

    2025年4月22日   

    BERT情感分析数据集-endofnight17j03 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本数据,BERT,机器学习,情感分类,文本挖掘,NLP 数据概述: 该数据集包含用于情感分析的文本数据,旨在训练和评估基于BERT(Bidirectional Encoder Representations from...
    packageimg
  • 新闻内容与摘要生成数据集-2019年-kevintoms

    2025年4月22日   

    新闻内容与摘要生成数据集-2019年-kevintoms 数据来源:互联网公开数据 标签:新闻,文本摘要,自然语言处理,NLP,机器学习,数据挖掘,实时数据 数据概述: 本数据集包含2019年1月份收集的新闻文章数据,旨在为文本摘要生成和分类问题提供支持。数据集包含两个主要字段: title:新闻标题,每条标题长度约为10-15字。...
    packageimg
  • VK群组内容与评论数据集

    2025年4月22日   

    VK群组内容与评论数据集 数据来源:互联网公开数据 标签:VK,社交媒体,NLP,数据预处理,机器学习,文本分析,情感分析,用户行为,内容分类 数据概述: 本数据集通过VK...
    packageimg
  • 英印机器翻译练习数据集-arunmohan003

    2025年4月22日   

    英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:...
    packageimg
  • 西班牙政治推特语料库2023-ricardomoya

    2025年4月22日   

    西班牙政治推特语料库2023-ricardomoya 数据来源:互联网公开数据 标签:推特,政治,西班牙,自然语言处理,NLP,机器学习,PSOE,PP,VOX,Unidas Podemos,Ciudadanos 数据概述: 本数据集包含来自西班牙主要政党(PSOE, PP, VOX, Unidas Podemos 和...
    packageimg
  • Spacy测试数据集SpacyTestDataset-hhhurenyuan

    2025年4月22日   

    Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • Spotify巴西热门歌词数据集-1947年至今-vitoriafirmino

    2025年4月22日   

    Spotify巴西热门歌词数据集-1947年至今-vitoriafirmino 数据来源:互联网公开数据 标签:歌词,巴西,Spotify,音乐,流行文化,语言学,NLP,情感分析,音乐趋势,时间序列 数据概述:...
    packageimg
  • 苹果2024秋季发布会iPhone16及相关产品发布内容转录数据集-nuhmanpk

    2025年4月22日   

    苹果2024秋季发布会iPhone16及相关产品发布内容转录数据集-nuhmanpk 数据来源:互联网公开数据 标签:苹果,发布会,文本转录,语音识别,情感分析,关键词提取,NLP,产品发布,Apple Watch,AirPods,iPhone 16,Apple Intelligence 数据概述: 本数据集为2024年苹果秋季发布会(Apple...
    packageimg
  • 数据2022年股市崩盘相关推特情感分析数据集-tejasurya

    2025年4月22日   

    2022年股市崩盘相关推特情感分析数据集-tejasurya 数据来源:互联网公开数据 标签:股市崩盘,推特,情感分析,NLP,金融新闻,2022年,市场趋势,话题建模,BERT 数据概述:...
    packageimg
  • Linux系统日志分析数据集2021-ggsri123

    2025年4月22日   

    Linux系统日志分析数据集2021-ggsri123 数据来源:互联网公开数据 标签:Linux,日志,系统监控,数据分析,异常检测,事件识别,多分类,模板匹配,NLP,开源数据 数据概述: 本数据集包含从LogPai...
    packageimg
  • 特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi

    2025年4月22日   

    特朗普总统政治集会演讲稿数据集-2017-2020年-tanpengshi 数据来源:互联网公开数据 标签:特朗普,政治,集会,演讲稿,文本,NLP,自然语言处理,美国大选,言论分析,数据挖掘 数据概述:...
    packageimg
  • 土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000

    2025年4月22日   

    土耳其语患者医生问答数据集-iCliniq平台-2024-kaayra2000 数据来源:互联网公开数据 标签:患者问答,医生回复,医疗咨询,土耳其语,NLP,自然语言处理,医疗研究,医学教育 数据概述: 本数据集收录了iCliniq平台上真实患者提出的医疗问题及其医生回复的土耳其语翻译版本。该数据集源于iCliniq Medical...
    packageimg
  • 推特情感分析数据集TweetSentimentExtractionDataset-tunguz

    2025年4月22日   

    推特情感分析数据集TweetSentimentExtractionDataset-tunguz 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,文本分类,机器学习,情感提取,社交媒体,NLP 数据概述: 该数据集包含来自推特(Twitter)的文本数据,旨在用于情感分析和情感提取任务。主要特征如下:...
    packageimg
  • 医疗文本PHI受保护健康信息标注数据集-vijayakashv03

    2025年4月22日   

    医疗文本PHI受保护健康信息标注数据集-vijayakashv03 数据来源:互联网公开数据 标签:PHI,医疗文本,数据标注,隐私保护,NLP,自然语言处理,文本处理,数据安全,敏感信息,信息脱敏 数据概述: 本数据集专为敏感信息脱敏设计,特别是受保护健康信息(PHI, Protected Health...
    packageimg
  • 亚马逊客户产品评价情感分类数据集-2021年-uday756

    2025年4月22日   

    亚马逊客户产品评价情感分类数据集-2021年-uday756 数据来源:互联网公开数据 标签:亚马逊,客户评价,情感分析,产品评价,自然语言处理,NLP,文本分类 数据概述:...
    packageimg
  • Yektanet波斯语网页文本主题分类数据集

    2025年4月22日   

    Yektanet波斯语网页文本主题分类数据集 数据来源:互联网公开数据 标签:波斯语,NLP,文本分类,机器学习,网页数据,主题识别,自然语言处理 数据概述:...
    packageimg
  • 垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal

    2025年4月22日   

    垃圾邮件过滤-电子邮件内容分类数据集-yashpaloswal 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分类,垃圾邮件,电子邮件,文本数据,机器学习,分类模型,邮件过滤,SPAM,HAM 数据概述:...
    packageimg
  • 推特言论分类-有害言论与无害言论识别数据集-grodzina

    2025年4月22日   

    推特言论分类-有害言论与无害言论识别数据集-grodzina 数据来源:互联网公开数据 标签:推特,有害言论,无害言论,自然语言处理,NLP,文本分类,社交媒体分析 数据概述:...
    packageimg
  • LLM基线模型评测数据集-aditya21511

    2025年4月22日   

    LLM基线模型评测数据集-aditya21511 数据来源:互联网公开数据 标签:大语言模型,LLM,基线模型,评测,NLP,自然语言处理,基准测试,性能评估 数据概述: 该数据集包含用于评估大语言模型(LLM)性能的基线模型评测数据,用于衡量LLM在不同任务上的表现。主要特征如下: 时间跨度:数据集涵盖了当前LLM发展阶段的多个时间点。...
    packageimg