找到11,713个数据集

标签: 自然语言处理

过滤结果
  • 斯洛伐克虚假新闻检测数据集-2023年-matejkore

    2025年4月22日   

    斯洛伐克虚假新闻检测数据集-2023年-matejkore 数据来源:互联网公开数据 标签:虚假新闻,斯洛伐克,文本分类,数据集,教育,研究,机器学习,自然语言处理 数据概述:...
    packageimg
  • 社交媒体虚假新闻内容识别数据集-abhayku2002

    2025年4月22日   

    社交媒体虚假新闻内容识别数据集-abhayku2002 数据来源:互联网公开数据 标签:虚假新闻,社交媒体,谣言,信息甄别,文本分析,自然语言处理,机器学习,舆情分析 数据概述:...
    packageimg
  • 维基百科电影剧情描述去名数据集-abbrivia

    2025年4月22日   

    维基百科电影剧情描述去名数据集-abbrivia 数据来源:互联网公开数据 标签:电影,剧情,自然语言处理,主题建模,停用词,名字识别,维基百科 数据概述: 本数据集包含从维基百科抓取的35,000部电影的剧情描述,并移除了其中的所有名字。数据集通过内置的命名实体识别(NER)技术生成,并经过hunspell...
    packageimg
  • 索马里语文本语料库-清洗后句子数据集-hassen7

    2025年4月22日   

    索马里语文本语料库-清洗后句子数据集-hassen7 数据来源:互联网公开数据 标签:索马里语,语言学,文本数据,自然语言处理,句子,清洗,语料库 数据概述:...
    packageimg
  • 教育类聊天机器人意图识别数据集-leewanhung

    2025年4月22日   

    教育类聊天机器人意图识别数据集-leewanhung 数据来源:互联网公开数据 标签:聊天机器人,意图识别,教育,自然语言处理,对话系统,机器学习,文本数据 数据概述: 本数据集旨在支持教育领域聊天机器人的构建,包含多种意图,以适应广泛的对话场景。 数据集包括核心意图和组合意图,旨在增强聊天机器人的交互能力。 核心意图:...
    packageimg
  • 数据2020至2023年英超转会新闻文章数据集-crxxom

    2025年4月22日   

    2020至2023年英超转会新闻文章数据集-crxxom 数据来源:互联网公开数据 标签:足球,转会市场,新闻,英超,自然语言处理,NLP,90min.com,体育新闻 数据概述:...
    packageimg
  • 新闻真伪辨别文本分类数据集-neupane9sujal

    2025年4月22日   

    新闻真伪辨别文本分类数据集-neupane9sujal 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,文本分类,自然语言处理,机器学习,标题,文本,标签 数据概述: 本数据集包含新闻文章的标题、正文以及真伪标签,可用于进行假新闻检测任务。数据集旨在帮助初学者学习文本分类技术,了解如何利用机器学习模型识别新闻的真伪。 数据包含以下字段:...
    packageimg
  • 斯瓦希里语句子标注数据集-2023-hassen7

    2025年4月22日   

    斯瓦希里语句子标注数据集-2023-hassen7 数据来源:互联网公开数据 标签:斯瓦希里语,句子标注,自然语言处理,文本分析,语言学,数据集,语料库 数据概述:...
    packageimg
  • 波斯语文章标注数据集

    2025年4月22日   

    波斯语文章标注数据集 数据来源:互联网公开数据 标签:波斯语,文章标注,自然语言处理,标签预测,写作辅助,内容分类,谷歌趋势 数据概述:...
    packageimg
  • 亚马逊EchoDotGen3产品评论情感分析数据集-pradeeshprabhakar

    2025年4月22日   

    亚马逊EchoDotGen3产品评论情感分析数据集-pradeeshprabhakar 数据来源:互联网公开数据 标签:亚马逊,Echo Dot,产品评论,情感分析,文本挖掘,自然语言处理,nltk,情感标签,消费者反馈 数据概述: 本数据集包含了从亚马逊印度站(amazon.in)上抓取的Echo Dot...
    packageimg
  • 教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz

    2025年4月22日   

    教育数据PII信息检测与移除数据集MiniDS版本1-训练集与验证集-neslihanozeryildiz 数据来源:互联网公开数据 标签:PII检测,教育数据,机器学习,自然语言处理,训练集,验证集,Kaggle,数据增强 数据概述: 本数据集是基于原始教育数据构建的,用于个人身份信息(PII,Personally Identifiable...
    packageimg
  • 电子商务嘈杂评论文本规范化数据集-sakshijain23

    2025年4月22日   

    电子商务嘈杂评论文本规范化数据集-sakshijain23 数据来源:互联网公开数据 标签:电商评论,文本规范化,自然语言处理,短语识别,数据清洗,文本分析 数据概述:...
    packageimg
  • ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir

    2025年4月21日   

    ChatGPT应用用户评价数据集-全球用户反馈-PlayStore-多国-2024-humairmunir 数据来源:互联网公开数据 标签:ChatGPT, 评论, 用户反馈, 情感分析, 自然语言处理, 应用评估, Play Store, 移动应用, 多语言, 市场调研 数据概述: 本数据集包含100,000条来自Google Play...
    packageimg
  • 特朗普政府简报与声明数据集

    2025年4月21日   

    特朗普政府简报与声明数据集 数据来源:互联网公开数据 标签:特朗普, 政府简报, 声明, 言论分析, 政策文本, 数据挖掘, 自然语言处理 数据概述 本数据集包含特朗普政府任期内所有公开的简报与声明内容,数据来源于白宫官方网站的“简报与声明”部分。数据集通过网络爬取方式获取,涵盖了特朗普政府期间发布的各类声明和简报,记录了其具体内容及相关元数据。...
    packageimg
  • 短信垃圾信息检测数据集-2023-faisalhossainruet

    2025年4月21日   

    短信垃圾信息检测数据集-2023-faisalhossainruet 数据来源:互联网公开数据 标签:短信,垃圾信息,文本处理,NLP,预处理,自然语言处理,机器学习,数据集 数据概述:...
    packageimg
  • 科学家与公众人物推文数据集

    2025年4月21日   

    科学家与公众人物推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,科学家,公众人物,时间序列,文本分析,自然语言处理 数据概述 本数据集包含来自多位活跃科学家和公众人物的推文记录,涵盖了从唐纳德·特朗普(Donald Trump)和希拉里·克林顿(Hillary Clinton)到尼尔·德格拉斯·泰森(Neil deGrasse...
    packageimg
  • 推特网络热门话题峰值检测数据集-milankalkenings

    2025年4月21日   

    推特网络热门话题峰值检测数据集-milankalkenings 数据来源:互联网公开数据 标签:推特,社交媒体,话题分析,峰值检测,时间序列,文本挖掘,数据挖掘,自然语言处理,内容摘要,话题演化 数据概述:...
    packageimg
  • 多场景对话数据集-2023-itsashyadav

    2025年4月21日   

    多场景对话数据集-2023-itsashyadav 数据来源:互联网公开数据 标签:对话数据,自然语言处理,社交互动,视频转录,人工智能,场景模拟,销售,事件讨论 数据概述:...
    packageimg
  • 人工智能论文摘要风格转换数据集-prathapkashyap

    2025年4月21日   

    人工智能论文摘要风格转换数据集-prathapkashyap 数据来源:互联网公开数据 标签:人工智能,论文摘要,风格转换,自然语言处理,平行语料库,GPT-4,文本生成,风格迁移 数据概述:...
    packageimg
  • 乌克兰语情感分析调查问卷回复数据集-annzhukova340

    2025年4月21日   

    乌克兰语情感分析调查问卷回复数据集-annzhukova340 数据来源:互联网公开数据 标签:乌克兰语,情感分析,文本分类,自然语言处理,调查数据,情感标签,机器学习,语言学 数据概述: 本数据集包含了18,000份以乌克兰语书写的调查问卷回复。 数据集经过平衡处理,包含: 9,000份正面回复 9,000份负面回复 每条记录由两部分组成:...
    packageimg