找到11,688个数据集

标签: 自然语言处理

过滤结果
  • 洛杉矶推特新闻数据集

    2025年4月14日   

    洛杉矶推特新闻数据集 数据来源:互联网公开数据 标签:洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日   

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg
  • YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024

    2025年4月14日   

    YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024 数据来源:互联网公开数据 标签:YouTube,视频评论,情感分析,自然语言处理,多语言,韩国,美食,社交媒体,用户互动 数据概述:...
    packageimg
  • NLP机器人用户提问意图分类数据集

    2025年4月14日   

    NLP机器人用户提问意图分类数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,用户提问,意图识别,文本分类,机器学习,人工智能,prompt,用户交互 数据概述: 本数据集旨在对NLP机器人接收到的用户提问进行分类。数据集的核心是用户输入的文本内容(即用户提问),并为每个提问标注了相应的类别标签,以反映用户提问的意图。...
    packageimg
  • 多领域罗马乌尔都语情感语料库数据集

    2025年4月14日   

    多领域罗马乌尔都语情感语料库数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,情感分析,多领域,文本数据,自然语言处理,机器学习 数据概述: 本数据集包含了近47,000条经过清理和预处理的评论,涵盖了多个领域的罗马乌尔都语文本。数据集中的情感被分为三大类:正面、负面和中性,适用于情感分析和自然语言处理任务。 数据用途概述:...
    packageimg
  • 多语言维基百科命名实体识别数据集

    2025年4月14日   

    多语言维基百科命名实体识别数据集 数据来源:互联网公开数据 标签:多语言,维基百科,命名实体识别,PER,LOC,ORG,MISC,自然语言处理,机器学习 数据概述:...
    packageimg
  • Digikala电商平台波斯语评论情感分析数据集

    2025年4月14日   

    Digikala电商平台波斯语评论情感分析数据集 数据来源:互联网公开数据 标签:电商评论,情感分析,波斯语,Digikala,用户评价,文本数据,自然语言处理,机器学习 数据概述:...
    packageimg
  • 情景喜剧神烦警探剧本对话数据集-第一季前四集

    2025年4月14日   

    情景喜剧神烦警探剧本对话数据集-第一季前四集 数据来源:互联网公开数据 标签:神烦警探,brooklyn99,剧本,对话,喜剧,角色,文本,Discord机器人,机器学习,自然语言处理 数据概述: 本数据集包含了情景喜剧《神烦警探》(Brooklyn Nine-Nine)第一季前四集的剧本对话内容。数据源自Brooklyn 99...
    packageimg
  • 越南语聊天机器人问题与答案数据集-版本2

    2025年4月14日   

    越南语聊天机器人问题与答案数据集-版本2 数据来源:互联网公开数据 标签:越南语,聊天机器人,问答系统,自然语言处理,多语言,用户交互,对话数据 数据概述:...
    packageimg
  • 尼泊尔COVID-19推文数据集

    2025年4月14日   

    尼泊尔COVID-19推文数据集 数据来源:互联网公开数据 标签:COVID-19,尼泊尔,推特,情感分析,深度学习,卷积神经网络,自然语言处理 数据概述:...
    packageimg
  • 降世神通-最后的气宗剧本数据集

    2025年4月14日   

    降世神通-最后的气宗剧本数据集 数据来源:互联网公开数据 标签:剧本分析,自然语言处理,机器学习,文本生成,文化研究,角色对话,故事情节 数据概述 本数据集包含了《降世神通:最后的气宗》(Avatar: The Last...
    packageimg
  • URL垃圾邮件分类数据集

    2025年4月14日   

    URL垃圾邮件分类数据集 数据来源:互联网公开数据 标签:URL,垃圾邮件,二元分类,机器学习,数据清洗,特征工程,自然语言处理,网络分析 数据概述: 本数据集包含约87.5万个URL,其中三分之一被标记为垃圾邮件URL,其余为非垃圾邮件URL。数据集由The...
    packageimg
  • 二手服装店客户评价分析数据集

    2025年4月14日   

    二手服装店客户评价分析数据集 数据来源:互联网公开数据 标签:客户评价,二手服装店,市场分析,竞争分析,自然语言处理,情感分析,主题建模 数据概述: 本数据集包含对三家二手服装店(RT、JAM和BUZZSTORE)的客户评价记录。数据集涵盖了客户的基本信息、评价日期、评价内容及评分等关键要素,为分析二手服装店的市场表现及客户反馈提供了全面的数据支持。...
    packageimg
  • 葡萄牙语金融新闻语义分析数据集

    2025年4月14日   

    葡萄牙语金融新闻语义分析数据集 数据来源:互联网公开数据 标签:金融新闻,语义分析,葡萄牙语,情感标注,经济文本,自然语言处理,文本翻译 数据概述: 本数据集为Financial Phrase...
    packageimg
  • 推特情感提取数据集

    2025年4月14日   

    推特情感提取数据集 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,机器学习,预测建模 数据概述:...
    packageimg
  • 抑郁症TF-IDF情感分析数据集

    2025年4月14日   

    抑郁症TF-IDF情感分析数据集 数据来源:互联网公开数据 标签:抑郁症,TF-IDF,情感分析,Reddit,文本数据,自然语言处理,社会情绪 数据概述: 本数据集基于Kaggle上的“Depression Reddit Cleaned”数据集创建,经过TF-...
    packageimg
  • 科研文章主题建模与标签预测数据集2022

    2025年4月14日   

    科研文章主题建模与标签预测数据集2022 数据来源:互联网公开数据 标签:科研文章,主题建模,自然语言处理,NLP,标签预测,计算机科学,数学,物理,统计学 数据概述:...
    packageimg
  • COVID-19假新闻数据集

    2025年4月14日   

    COVID-19假新闻数据集 数据来源:互联网公开数据 标签:COVID-19,假新闻,社交媒体,数据挖掘,自然语言处理,信息验证,社会影响 数据概述:...
    packageimg
  • 推特仇恨言论检测数据集

    2025年4月14日   

    推特仇恨言论检测数据集 数据来源:互联网公开数据 标签:仇恨言论,推特,社交媒体分析,自然语言处理,机器学习,文本分类,情感分析 数据概述:...
    packageimg
  • 有毒评论分类数据集

    2025年4月14日   

    有毒评论分类数据集 数据来源:互联网公开数据 标签:有毒评论,自然语言处理,情感分析,文本分类,机器学习,数据标注,内容安全 数据概述:...
    packageimg