找到11,969个数据集

标签: 自然语言处理

过滤结果
  • CNBC印度新闻头条数据集

    2025年4月15日   

    CNBC印度新闻头条数据集 数据来源:互联网公开数据 标签:新闻头条, CNBC印度, 话题建模, 自然语言处理, 时间序列, 媒体分析 数据概述:...
    packageimg
  • 印度互联网仇恨言论识别数据集2023

    2025年4月15日   

    印度互联网仇恨言论识别数据集2023 数据来源:互联网公开数据 标签:仇恨言论,内容审核,文本分析,社交媒体,自然语言处理,人工智能,互联网治理 数据概述: 本数据集用于识别文本输入中是否包含仇恨言论,涵盖了大量的互联网文本样本。数据集旨在为开发和评估仇恨言论检测模型提供训练数据基础,支持对不恰当和有害在线内容进行有效管理。 数据用途概述:...
    packageimg
  • 多人在线角色扮演游戏神谕之战Dofus游戏物品及阿尔玛纳克数据集合

    2025年4月15日   

    多人在线角色扮演游戏神谕之战Dofus游戏物品及阿尔玛纳克数据集合 数据来源:互联网公开数据 标签:Dofus, 神谕之战, 游戏数据, 物品, 阿尔玛纳克, 游戏分析, 自然语言处理, 数据挖掘, 游戏攻略 数据概述:...
    packageimg
  • 土耳其真假评论数据集

    2025年4月15日   

    土耳其真假评论数据集 数据来源:互联网公开数据 标签:土耳其,评论分析,假新闻,深度学习,文本生成,自然语言处理,机器学习,数据标注 数据概述:...
    packageimg
  • 旁遮普语沙木基语料库词频统计数据集

    2025年4月15日   

    旁遮普语沙木基语料库词频统计数据集 数据来源:互联网公开数据 标签:旁遮普语,沙木基语,语言学,词频统计,文本分析,自然语言处理,语料库 数据概述: 本数据集基于从互联网收集的旁遮普语沙木基语料库构建而成,包含单字词(unigram)和双字词(bigram)的频率统计信息。 数据文件包括: unigram-p.csv:包含50,000个单字词及其词频。...
    packageimg
  • 常见鸟类名称数据集

    2025年4月15日   

    常见鸟类名称数据集 数据来源:互联网公开数据 标签:鸟类名称,文本生成,RNN,LSTM,深度学习,自然语言处理,项目数据集 数据概述: 本数据集包含10976个常见鸟类名称,来源于维基百科的常见鸟类名称列表。数据集以CSV格式提供,包含两列信息:ID(整数类型),为每个鸟类名称分配的唯一标识;Common Bird...
    packageimg
  • 数据20新闻组文本分类研究数据集2023

    2025年4月15日   

    数据20新闻组文本分类研究数据集2023 数据来源:互联网公开数据 标签:文本分类,自然语言处理,20新闻组,数据清洗,机器学习,情感分析,主题建模 数据概述: 本数据集是基于scikit-...
    packageimg
  • 阿拉伯诗歌诗句与解释数据集

    2025年4月15日   

    阿拉伯诗歌诗句与解释数据集 数据来源:互联网公开数据 标签:阿拉伯诗歌,诗句,解释,AI,自然语言处理,诗歌分析,文学研究,文化研究 数据概述:...
    packageimg
  • 全面生物医学实体识别数据集

    2025年4月15日   

    全面生物医学实体识别数据集 数据来源:互联网公开数据 标签:生物医学,实体识别,自然语言处理,机器学习,药物描述,专利摘要,文本分析 数据概述:...
    packageimg
  • Phoronix科技新闻文章标题与内容数据集

    2025年4月15日   

    Phoronix科技新闻文章标题与内容数据集 数据来源:互联网公开数据 标签:科技新闻,NLP,文本分析,自然语言处理,新闻文章,Phoronix,文章标题,文本数据,数据挖掘 数据概述:...
    packageimg
  • 英国广播公司BBC新闻文章文本数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本数据集 数据来源:互联网公开数据 标签:新闻文章,文本数据,BBC,媒体,内容分析,自然语言处理,文本挖掘,英国 数据概述: 本数据集包含英国广播公司(BBC)发布的新闻文章文本内容。数据以CSV格式存储,原始数据为TXT格式。数据集涵盖了BBC新闻文章的标题、正文以及可能包含的发布日期、所属类别等元数据。 数据用途概述:...
    packageimg
  • 自然语言到SQL映射语料库数据集

    2025年4月15日   

    自然语言到SQL映射语料库数据集 数据来源:互联网公开数据 标签:SQL查询,人工智能模型,预测,自然语言处理,数据库查询,文本转换 数据概述: 本数据集包含用于创建预测下一个SQL查询的人工智能模型的数据。数据集来源于两个GitHub仓库:https://github.com/RemilYoucef/sd-4sql 和...
    packageimg
  • 孟加拉语气候变化与环境新闻观点分析数据集-Dhoroni-2024

    2025年4月15日   

    孟加拉语气候变化与环境新闻观点分析数据集-Dhoroni-2024 数据来源:互联网公开数据 标签:气候变化,环境,新闻,孟加拉语,NLP,自然语言处理,文本分析,观点分析,立场检测,数据集 数据概述:...
    packageimg
  • 谷歌应用商店App评论情感分析数据集-时间不限

    2025年4月15日   

    谷歌应用商店App评论情感分析数据集-时间不限 数据来源:互联网公开数据 标签:谷歌应用商店,App评论,情感分析,用户反馈,文本数据,自然语言处理,移动应用,数据挖掘 数据概述: 本数据集包含了从谷歌应用商店抓取并清洗后的App数据和评论信息。 数据集涵盖了大量App的详细信息以及用户对其的评价内容,为进行情感分析提供了丰富的数据基础。...
    packageimg
  • 约瑟夫罗根播客评论数据集2023

    2025年4月15日   

    约瑟夫罗根播客评论数据集2023 数据来源:互联网公开数据 标签:约瑟夫罗根,播客评论,自然语言处理,情感分析,词性分析,观众反馈 数据概述:...
    packageimg
  • 精神健康聊天机器人对话对

    2025年4月15日   

    精神健康聊天机器人对话对 数据来源:互联网公开数据 标签:精神健康,聊天机器人,人工智能,自然语言处理,心理健康支持,个性化推荐,对话分析 数据概述:...
    packageimg
  • 莫斯科Parajumpers品牌产品描述质量评估数据集

    2025年4月15日   

    莫斯科Parajumpers品牌产品描述质量评估数据集 数据来源:互联网公开数据 标签:Parajumpers,产品描述,质量评估,莫斯科,文本分析,机器学习,自然语言处理,俄语 数据概述:...
    packageimg
  • 即时通讯应用评价数据集

    2025年4月15日   

    即时通讯应用评价数据集 数据来源:互联网公开数据 标签:即时通讯应用,客户评价,多语言数据,谷歌Play商店,文本分析,情感分析,自然语言处理 数据概述...
    packageimg
  • 疾病文章数据集

    2025年4月15日   

    疾病文章数据集 数据来源:互联网公开数据 标签:疾病,文章,文本处理,自然语言处理,Spacy,BERT,机器学习 数据概述:...
    packageimg
  • 土耳其语文本分类预处理数据集

    2025年4月15日   

    土耳其语文本分类预处理数据集 数据来源:互联网公开数据 标签:文本分类,土耳其语,预处理,机器学习,自然语言处理,文本挖掘 数据概述:...
    packageimg