找到1个数据集

标签: 安全协议优化

过滤结果
  • LLM_Comment_Vulnerability_基于代码注释的LLM对抗攻击测试数据集

    2026年1月12日 30 192 168

    数据集概述 本数据集包含200个针对大语言模型(LLMs)的测试提示词,旨在评估模型对隐藏在误导性代码注释中的对抗攻击的敏感性。数据源自“Do Not Answer”数据集,涵盖7类危害场景与5种叙事框架,每个条目含提示词ID、类别、叙事类型、含误导性注释的代码片段、攻击类型、预期有害行为等信息,用于分析LLM对欺骗性注释的误判问题。 文件详解...
    packageimg