aspear_Source_SaferDecoding大语言模型对抗性提示防御微调数据集

本数据集用于微调模型以防御jailbreak攻击，是SafeDecoding的扩展。包含252条人类生成的原始对抗性种子提示（覆盖18个有害类别），以及Llama2、Vicuna、Dolphin、Falcon、Guanaco模型针对这些提示生成的拒绝请求的响应数据。

文件名称：finetune.json
文件格式：JSON
字段映射介绍：包含原始人类生成的对抗性种子提示（覆盖18个有害类别），以及Llama2、Vicuna、Dolphin、Falcon、Guanaco模型针对提示生成的拒绝响应记录。无训练/测试、数据/标签、原始/处理数据的划分。

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	0.96 MiB
最后更新	2026年1月13日
创建于	2026年1月13日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。