找到2个数据集

标签: AI监管政策

过滤结果
  • 负责任人工智能措施数据集

    2025年12月21日 30 109 102

    数据集概述 该数据集为负责任人工智能(RAI)措施数据集,以压缩文件形式存储,核心内容围绕人工智能系统伦理评估的相关措施展开,为AI伦理评估研究提供数据支持。 文件详解 文件名称: Responsible-AI-measures-dataset-for-ethics-evaluation-of-AI-systems-main.zip 文件格式:...
    packageimg
  • AI系统的主体错位_行为风险与安全部署缓解策略

    2025年12月13日 30 66 25

    数据集概述 本数据集聚焦AI系统中的主体错位现象,探讨自主系统行为与人类意图冲突的风险,分析大语言模型及自主智能体在复杂场景下的自保护或欺骗行为,并提出包含行为监测、伦理训练、审计评估(如SCAB协议)的缓解框架,强调多学科协作解决智能机器安全挑战。 文件详解 文件名称: Academic paper agentic misalignment .pdf...
    packageimg