找到11,679个数据集

标签: 自然语言处理

过滤结果
  • 仇恨言论检测模型性能评估数据集

    2025年4月14日   

    仇恨言论检测模型性能评估数据集 数据来源:互联网公开数据 标签:仇恨言论检测, 自然语言处理, 模型评估, 文本分类, 机器学习, 偏见检测, 功能测试 数据概述: 本数据集“HateCheck”是一套用于评估仇恨言论检测模型性能的功能测试集。 数据集包含3728个经过验证的测试案例,涵盖了29种功能测试。...
    packageimg
  • 普丁与卡尔森访谈公众情感数据集

    2025年4月14日   

    普丁与卡尔森访谈公众情感数据集 数据来源:互联网公开数据 标签:公众情感,普丁,卡尔森,访谈,意见分析,自然语言处理,机器学习,数据可视化 数据概述:...
    packageimg
  • Telegram消息垃圾信息与正常信息分类数据集

    2025年4月14日   

    Telegram消息垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:Telegram,消息分类,垃圾信息,自然语言处理,文本分析,机器学习,数据,Spam,Ham 数据概述:...
    packageimg
  • 性别偏见分析数据集

    2025年4月14日   

    性别偏见分析数据集 数据来源:互联网公开数据 标签:性别偏见,年龄偏见,澳大利亚,工作广告,自然语言处理,机器学习,数据偏见,公平性研究 数据概述: 本数据集与论文《Developing a Large-Scale Language Model to Unveil and Alleviate Gender and Age Biases in...
    packageimg
  • 推特话题汇总数据集

    2025年4月14日   

    推特话题汇总数据集 数据来源:互联网公开数据 标签:推特,话题汇总,自然语言处理,文本分析,社会媒体,教育,研究,自动化摘要 数据概述: 本数据集包含了来自不同话题标签的推文摘要,总计1950条记录。这些推文摘要通过先进的自然语言处理模型ChatGPT系统生成,为教育和研究提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • 巴西葡萄牙语股票市场推文数据集

    2025年4月14日   

    巴西葡萄牙语股票市场推文数据集 数据来源:互联网公开数据 标签:股票市场,推文,自然语言处理,实体识别,HAREM,巴西,情感分类 数据概述: 本数据集包含4,048条用巴西葡萄牙语编写的股票市场相关推文,并根据HAREM的分类法进行了实体识别标注。这些推文最初用于情感分类研究,并且已经完成了情感分类的标注。 数据用途概述:...
    packageimg
  • 最近新闻推文情感分析与分类数据集

    2025年4月14日   

    最近新闻推文情感分析与分类数据集 数据来源:互联网公开数据 标签:新闻推文,情感分析,分类,社交媒体分析,自然语言处理,公众情绪,舆情分析 数据概述:...
    packageimg
  • YouTube评论情感分析数据集

    2025年4月14日   

    YouTube评论情感分析数据集 数据来源:互联网公开数据 标签:YouTube,评论,情感分析,自然语言处理,文本分类,情感标注,机器学习 数据概述:...
    packageimg
  • 斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集

    2025年4月14日   

    斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料 数据概述: 本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集,按照80:20的比例划分。GINCO...
    packageimg
  • 可解释AI文献数据集

    2025年4月14日   

    可解释AI文献数据集 数据来源:互联网公开数据 标签:可解释AI,机器学习,人工智能,学术研究,自然语言处理,数据分析,技术趋势 数据概述: 本数据集来源于Cornell University发布的arXiv文献集,精选了与“可解释AI(Explainable...
    packageimg
  • 文本改写数据集PAWS

    2025年4月14日   

    文本改写数据集PAWS 数据来源:互联网公开数据 标签:文本改写,语义理解,句子对齐,自然语言处理,机器学习,模式识别 数据概述: 本数据集PAWS(Paraphrase Word...
    packageimg
  • LLM20问题解决方案关键词频率数据集

    2025年4月14日   

    LLM20问题解决方案关键词频率数据集 数据来源:互联网公开数据 标签:LLM,20问题解决方案,关键词频率,自然语言处理,机器学习,数据分析 数据概述: 本数据集包含用于解决LLM(大语言模型)20个问题的过滤后关键词列表及其出现频率。数据涵盖了与20个问题相关的常用关键词及其在解决方案中的使用频率,为研究和开发提供了宝贵的语言模型训练资源。...
    packageimg
  • 社交智能问答数据集-社会互动情境问答数据集

    2025年4月14日   

    社交智能问答数据集-社会互动情境问答数据集 数据来源:互联网公开数据 标签:社交智能,问答,常识推理,自然语言处理,机器学习,社会情境,文本分析 数据概述: 本数据集名为“Social IQa (Social Interaction Q&A)”,是一个用于评估模型社会常识推理能力的问答基准。与以往侧重于物理或分类知识的基准不同,Social...
    packageimg
  • 推特讽刺分类数据集

    2025年4月14日   

    推特讽刺分类数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,NLP,社交媒体分析,文本分类,讽刺检测,推特数据 数据概述: 本数据集包含了大量推特帖子,并被分类为讽刺性内容,并进一步细分为不同的讽刺子类别。该数据集为自然语言处理领域的学习者提供了宝贵的资源,可用于训练和测试模型。 数据用途概述:...
    packageimg
  • 俄罗斯央行官方声明数据集2023

    2025年4月14日   

    俄罗斯央行官方声明数据集2023 数据来源:互联网公开数据 标签:俄罗斯央行,官方声明,经济数据,时间序列,自然语言处理,情感分析,金融研究 数据概述:...
    packageimg
  • 印度顶级教育应用用户评论数据集

    2025年4月14日   

    印度顶级教育应用用户评论数据集 数据来源:互联网公开数据 标签:印度,教育应用,用户评论,在线教育,自然语言处理,应用分析,用户反馈 数据概述: 本数据集包含印度顶级教育应用的用户评论信息,旨在通过分析用户反馈来了解这些应用的服务质量和用户体验。数据来源于Google Play...
    packageimg
  • 客户服务培训对话数据集-2-7万条

    2025年4月14日   

    客户服务培训对话数据集-2-7万条 数据来源:互联网公开数据 标签:客户服务,对话,问答对,自然语言处理,机器学习,聊天机器人,客服,文本数据,训练数据 数据概述:...
    packageimg
  • 英文新闻数据集

    2025年4月14日   

    英文新闻数据集 数据来源:互联网公开数据 标签:英文新闻,文本分类,机器学习,自然语言处理,数据预处理 数据概述: 本数据集包含5个类别,共1491条英文新闻记录。数据集涵盖多种新闻类型,提供了丰富的文本数据资源,适用于文本分类和自然语言处理等任务。 数据用途概述:...
    packageimg
  • 数据1000对孟加拉语到俄语翻译数据集

    2025年4月14日   

    数据1000对孟加拉语到俄语翻译数据集 数据来源:互联网公开数据 标签:孟加拉语,俄语,翻译,语言学研究,机器翻译,语料库,双语系统,自然语言处理 数据概述:...
    packageimg
  • 罗马乌尔都语仇恨言论检测数据集

    2025年4月14日   

    罗马乌尔都语仇恨言论检测数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,仇恨言论,社交媒体评论,数据融合,文本分析,自然语言处理 数据概述: 本数据集是由三个数据集合并而成,分别是RomanUrduDataSet、HS-RU-20和roman-Urdu-abusive-comment-...
    packageimg