找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 句子完成度预测文本分类数据集

    2025年4月14日   

    句子完成度预测文本分类数据集 数据来源:互联网公开数据 标签:自然语言处理,句子完成度,文本分类,弱监督学习,新闻头条,文本数据清理 数据概述:...
    packageimg
  • 数据2019-2023印度尼西亚招聘信息推文数据集

    2025年4月14日   

    数据2019-2023印度尼西亚招聘信息推文数据集 数据来源:互联网公开数据 标签:招聘信息,推文,自然语言处理,市场分析,公司需求,角色需求,社交媒体 数据概述: 本数据集包含2019年1月1日至2023年4月10日期间与职位空缺和招聘相关的50,000条推文。推文通过关键词“Job Vacancy”、“We are Hiring”和“We're...
    packageimg
  • 电影对话语料库第二部分

    2025年4月14日   

    电影对话语料库第二部分 数据来源:互联网公开数据 标签:电影对话,语料库,自然语言处理,语音识别,时间标注,电影分析 数据概述:...
    packageimg
  • 孟加拉语讽刺检测数据集2022

    2025年4月14日   

    孟加拉语讽刺检测数据集2022 数据来源:互联网公开数据 标签:讽刺检测,孟加拉语,自然语言处理,文本分析,深度学习,BERT,可解释AI 数据概述:...
    packageimg
  • 仇恨言论检测模型性能评估数据集

    2025年4月14日   

    仇恨言论检测模型性能评估数据集 数据来源:互联网公开数据 标签:仇恨言论检测, 自然语言处理, 模型评估, 文本分类, 机器学习, 偏见检测, 功能测试 数据概述: 本数据集“HateCheck”是一套用于评估仇恨言论检测模型性能的功能测试集。 数据集包含3728个经过验证的测试案例,涵盖了29种功能测试。...
    packageimg
  • 海贼王角色数据集

    2025年4月14日   

    海贼王角色数据集 数据来源:互联网公开数据 标签:海贼王,日本漫画,角色信息,动漫数据,人物特征,配音信息,职业设定,角色关系 数据概述: 本数据集收录了《海贼王》漫画系列中所有正篇角色的详细信息,数据来自One Piece...
    packageimg
  • 普丁与卡尔森访谈公众情感数据集

    2025年4月14日   

    普丁与卡尔森访谈公众情感数据集 数据来源:互联网公开数据 标签:公众情感,普丁,卡尔森,访谈,意见分析,自然语言处理,机器学习,数据可视化 数据概述:...
    packageimg
  • 不健康评论识别数据集1963-2021

    2025年4月14日   

    不健康评论识别数据集1963-2021 数据来源:互联网公开数据 标签:不健康评论,在线交流,情感分析,机器学习,数据标注,语义识别 数据概述: 本数据集包含了44355条评论,旨在帮助研究在线不健康对话中细微属性的识别。每条评论都被标记为“健康”或“不健康”,并附加了六种潜在“不健康”子属性的二元标签:(1) 敌意;(2) 对立、侮辱、挑衅或...
    packageimg
  • F-R-I-E-N-D-S情景喜剧数据集

    2025年4月14日   

    F-R-I-E-N-D-S情景喜剧数据集 数据来源:互联网公开数据 标签:情景喜剧,数据集,文本分析,电视节目,对话记录,角色分析,社交互动 数据概述:...
    packageimg
  • Telegram消息垃圾信息与正常信息分类数据集

    2025年4月14日   

    Telegram消息垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:Telegram,消息分类,垃圾信息,自然语言处理,文本分析,机器学习,数据,Spam,Ham 数据概述:...
    packageimg
  • 在线内容事实核查数据集

    2025年4月14日   

    在线内容事实核查数据集 数据来源:互联网公开数据 标签:在线内容,事实核查,信息准确性,谣言检测,虚假信息,传播追踪,社会媒体,政治宣传,信息可靠性 数据概述:...
    packageimg
  • 性别偏见分析数据集

    2025年4月14日   

    性别偏见分析数据集 数据来源:互联网公开数据 标签:性别偏见,年龄偏见,澳大利亚,工作广告,自然语言处理,机器学习,数据偏见,公平性研究 数据概述: 本数据集与论文《Developing a Large-Scale Language Model to Unveil and Alleviate Gender and Age Biases in...
    packageimg
  • 虚假信息数据集

    2025年4月14日   

    虚假信息数据集 数据来源:互联网公开数据 标签:虚假信息,反误导,数据集,假新闻分类 数据概述: 本数据集包含30,243条被可信事实核查机构证实为虚假的信息声明。每条声明记录了其被揭露的日期、传播的地理位置以及使用的语言。这些信息全面概述了虚假信息在不同地区和语言间的传播和被揭露情况。 数据用途概述:...
    packageimg
  • 美国总统行政命令文本数据集-克林顿至拜登

    2025年4月14日   

    美国总统行政命令文本数据集-克林顿至拜登 数据来源:互联网公开数据 标签:行政命令,美国,总统,政策,政治,政府,法律,克林顿,布什,奥巴马,特朗普,拜登 数据概述:...
    packageimg
  • 推特话题汇总数据集

    2025年4月14日   

    推特话题汇总数据集 数据来源:互联网公开数据 标签:推特,话题汇总,自然语言处理,文本分析,社会媒体,教育,研究,自动化摘要 数据概述: 本数据集包含了来自不同话题标签的推文摘要,总计1950条记录。这些推文摘要通过先进的自然语言处理模型ChatGPT系统生成,为教育和研究提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • 金融新闻情感数据集

    2025年4月14日   

    金融新闻情感数据集 数据来源:互联网公开数据 标签:金融新闻,情感分析,NLP,文本处理,数据清洗,股票市场 数据概述: 本数据集包含标注了情感标签的金融新闻文本,适用于自然语言处理(NLP)任务。数据集经过了一系列文本处理操作,包括去除空值、删除重复项、平衡各类情感标签的数量、去除前后空格和换行符、移除URL、展开缩写(如将“it's”转换为“it...
    packageimg
  • 巴西葡萄牙语股票市场推文数据集

    2025年4月14日   

    巴西葡萄牙语股票市场推文数据集 数据来源:互联网公开数据 标签:股票市场,推文,自然语言处理,实体识别,HAREM,巴西,情感分类 数据概述: 本数据集包含4,048条用巴西葡萄牙语编写的股票市场相关推文,并根据HAREM的分类法进行了实体识别标注。这些推文最初用于情感分类研究,并且已经完成了情感分类的标注。 数据用途概述:...
    packageimg
  • 最近新闻推文情感分析与分类数据集

    2025年4月14日   

    最近新闻推文情感分析与分类数据集 数据来源:互联网公开数据 标签:新闻推文,情感分析,分类,社交媒体分析,自然语言处理,公众情绪,舆情分析 数据概述:...
    packageimg
  • 客户到客户电商平台影响者分析数据集

    2025年4月14日   

    客户到客户电商平台影响者分析数据集 数据来源:互联网公开数据 标签:影响者分析,电商平台,C2C,消费者行为,市场研究,数据分析,电商营销 数据概述:...
    packageimg
  • 智慧楼宇管理系统传感器名称元数据集

    2025年4月14日   

    智慧楼宇管理系统传感器名称元数据集 数据来源:互联网公开数据 标签:智慧楼宇,传感器名称,自动分割,无监督学习,神经语言模型,元数据 数据概述:...
    packageimg