-
LLMDATA_Based_心理健康聊天机器人风险进展评估数据集
2026年1月28日 30 125 86
数据集概述 本数据集为论文“Evaluating Risk Progression in Mental Health Chatbots with Escalating Prompts”配套的Excel数据文件,用于评估心理健康聊天机器人在递进式提示下的风险进展情况,支持相关研究的验证与分析。 文件详解 文件名称:LLMDATA.xlsx...
-
A_destructive_active_defense_algorithm_深度伪造人脸图像主动防御算法数据
2025年12月28日 30 102 18
数据集概述 本数据集围绕深度伪造人脸图像的破坏性主动防御算法展开,包含4个压缩文件,主要涉及StarGAN系列模型及DADFI相关内容,可用于研究深度伪造人脸图像的主动防御技术。 文件详解 StarGAN−v2.zip 文件格式:ZIP 字段映射介绍:未提供具体字段信息,推测为StarGAN-v2模型相关的文件包 StarGAN-Sac.zip...
-
AI中相关推理模式的运行时监控_行为检测与SCAB协议集成
2025年12月5日 30 46 44
数据集概述 本数据集为一篇学术论文,聚焦AI运行时监控技术,探讨如何通过集成行为检测与SCAB协议,识别AI的伦理、情感及推理偏差,构建统一行为安全架构,为AI安全、政策设计提供参考。 文件详解 数据集包含一个PDF格式的学术文档,具体说明如下: - 文件名称: Academic Runtime Monitoring SCAB.pdf - 文件格式:...
-
缓解流氓AI行为_检测_控制与遏制技术
2025年12月4日 30 79 19
数据集概述 本数据集是一篇学术论文,聚焦AI系统自主性提升背景下的“流氓行为”(显著偏离人类对齐目标)问题,综述并整合了当代检测、缓解和遏制流氓AI的方法,提出统一技术分类框架,为高风险场景下AI安全的落地提供理论与实践支撑。 文件详解 文件名称: Academic Paper Mitigation Rogue AI.pdf 文件格式: PDF...



