找到11,708个数据集

标签: 自然语言处理

过滤结果
  • 抑郁症分类数据集-2022-vhonghoavin

    2025年4月21日   

    抑郁症分类数据集-2022-vhonghoavin 数据来源:互联网公开数据 标签:抑郁症,情感分析,自然语言处理,机器学习,心理健康,数据预处理,文本分类 数据概述: 本数据集源自DepSign-LT-...
    packageimg
  • 维基百科讨论页评论数据集个人攻击标签

    2025年4月21日   

    维基百科讨论页评论数据集个人攻击标签 数据来源:互联网公开数据 标签:维基百科,讨论页,个人攻击,毒性评论,自然语言处理,机器学习,数据集 数据概述:...
    packageimg
  • 自然语言处理-职业意图项目数据集

    2025年4月21日   

    自然语言处理-职业意图项目数据集 数据来源:互联网公开数据 标签:自然语言处理,职业意图,文本分类,模型训练,数据集,机器学习,深度学习 数据概述:...
    packageimg
  • 房地产推文情感分析数据集

    2025年4月21日   

    房地产推文情感分析数据集 数据来源:互联网公开数据 标签:房地产,推文,情感分析,BERT,自然语言处理,社交媒体数据,投资分析,市场情绪 数据概述: 本数据集包含了从社交媒体平台收集的与房地产相关的推文,并通过BERT(Hugging...
    packageimg
  • 不明飞行物目击事件完整描述数据集

    2025年4月21日   

    不明飞行物目击事件完整描述数据集 数据来源:互联网公开数据 标签:不明飞行物,UFO,目击事件,NLP,自然语言处理,文本分析,描述,报告,事件,NUFORC 数据概述:...
    packageimg
  • 推特情感分析数据集-社交媒体文本情感分类-公开推文数据

    2025年4月21日   

    推特情感分析数据集-社交媒体文本情感分类-公开推文数据 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,文本挖掘,自然语言处理,情感分类,机器学习 数据概述:...
    packageimg
  • 英法翻译数据集-英语至法语翻译项目-数据-通用

    2025年4月21日   

    英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-...
    packageimg
  • 网络海量数据俳句文本挖掘与人工校验数据集-2023年10月

    2025年4月21日   

    网络海量数据俳句文本挖掘与人工校验数据集-2023年10月 数据来源:互联网公开数据 标签:俳句,诗歌,文本挖掘,自然语言处理,诗歌创作,文本分析,机器学习,网络数据 数据概述:...
    packageimg
  • 虚假新闻识别文本数据集

    2025年4月21日   

    虚假新闻识别文本数据集 数据来源:互联网公开数据 标签:虚假新闻,新闻文本,自然语言处理,文本分类,机器学习,舆情分析,新闻真伪,网络安全 数据概述: 本数据集来源于《机器学习在网络安全中的应用》一书的第四章,包含了虚假新闻和真实新闻文章的集合。数据集旨在为研究人员和实践者提供一个用于虚假新闻检测和分析的资源。 数据用途概述:...
    packageimg
  • 英文小说文本数据集

    2025年4月21日   

    英文小说文本数据集 数据来源:互联网公开数据 标签:英文小说,自然语言处理,NLP,文本分类,文本摘要,文学作品,预处理,内容过滤 数据概述: 本数据集包含一系列英文小说文本,适用于自然语言处理(NLP)任务,例如文本分类、文本摘要等。数据集基于Project...
    packageimg
  • IMDB电影评论情感分析数据集-电影评论情感分类预测

    2025年4月21日   

    IMDB电影评论情感分析数据集-电影评论情感分类预测 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本分类,机器学习,IMDB,情感,评论,文本数据 数据概述:...
    packageimg
  • 大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛

    2025年4月20日   

    大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛 数据来源:互联网公开数据 标签:LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据 数据概述: 本数据集是为LLM(大型语言模型)生成文本检测竞赛收集的。数据来源于多个公开的文本资源,涵盖了不同来源和类型的文本,旨在用于训练和评估检测模型,以识别由LLM生成的文本。...
    packageimg
  • SuperGLUE自然语言理解任务基准数据集

    2025年4月20日   

    SuperGLUE自然语言理解任务基准数据集 数据来源:互联网公开数据 标签:自然语言处理, NLP, 语言理解, 文本分类, 问答, 语义推理, 多任务学习 数据概述: SuperGLUE 是一个由多个具有挑战性的自然语言理解(NLU)任务组成的数据集,旨在评估模型的泛化能力和对复杂语言现象的理解程度。该基准测试是 GLUE(General...
    packageimg
  • 互联网电影数据库电影评论情感分析数据集

    2025年4月20日   

    互联网电影数据库电影评论情感分析数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本挖掘,机器学习,IMDb,电影,评论,情感,积极,消极 数据概述:...
    packageimg
  • 提示注入攻击实例数据集

    2025年4月20日   

    提示注入攻击实例数据集 数据来源:互联网公开数据 标签:提示注入,自然语言处理,网络安全,机器学习,对抗攻击,数据安全 数据概述: 本数据集汇集了从Hugging...
    packageimg
  • BERT768维嵌入文章数据集

    2025年4月20日   

    BERT768维嵌入文章数据集 数据来源:互联网公开数据 标签:BERT, 自然语言处理, 文章嵌入, COVID-19研究, 文本分析, 机器学习, 深度学习 数据概述: 本数据集包含了从COVID-19开放研究数据集挑战(CORD-19)中提取的27,648篇文章的BERT...
    packageimg
  • HellaSwag常识推理数据集-句子补全任务-通用

    2025年4月20日   

    HellaSwag常识推理数据集-句子补全任务-通用 数据来源:互联网公开数据 标签:自然语言处理,常识推理,句子补全,NLI,语言理解,文本生成,机器学习,人工智能 数据概述:...
    packageimg
  • 多源对话数据集

    2025年4月20日   

    多源对话数据集 数据来源:互联网公开数据 标签:对话数据,多源对话,自然语言处理,机器学习,聊天机器人,对话生成,情感分析 数据概述:...
    packageimg
  • 亚马逊精细食品评论数据集

    2025年4月20日   

    亚马逊精细食品评论数据集 数据来源:互联网公开数据 标签:评论分析,情感分析,文本挖掘,食品行业,用户行为,自然语言处理,文本预处理 数据概述:...
    packageimg
  • 电影评论情感分析IMDB数据集-50000条评论

    2025年4月20日   

    电影评论情感分析IMDB数据集-50000条评论 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,机器学习,电影评论,二元分类,IMDB 数据概述: IMDB数据集是一个包含50,000条电影评论的宝贵资源,非常适合用于自然语言处理和文本分析研究。该数据集是进行二元情感分类任务的理想选择,其数据覆盖范围超过了以往的基准数据集。...
    packageimg