数据集概述
本数据集是论文《Mitigating Sensitive Information Leakage in LLMs4Code through Machine Unlearning》的配套资源,包含研究所需的数据集和源码,压缩为单个ZIP文件。数据集存储于"数据"文件夹,推理结果位于"推理结果"文件夹,运行说明可参考"readme.md"文件,支持复现论文中的大语言模型代码敏感信息泄露缓解研究。
文件详解
- 文件名称:Mitigating Sensitive Information Leakage in LLMs4Code through Machine Unlearning.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含两类核心内容,一是存储于"data"文件夹的研究数据集,二是存储于"infer result"文件夹的推理结果文件,同时提供"readme.md"文件说明代码运行方法,无明确字段映射信息。
数据来源
论文"Mitigating Sensitive Information Leakage in LLMs4Code through Machine Unlearning"
适用场景
- 大语言模型代码安全研究: 复现LLMs4Code中敏感信息泄露的缓解实验,分析机器学习遗忘技术的有效性。
- 代码生成模型隐私保护: 探索代码领域大语言模型的敏感信息泄露机制与防护方法。
- 机器学习遗忘技术验证: 验证机器遗忘技术在代码大语言模型中的应用效果与性能影响。
- 学术研究复现: 支持其他研究者复现论文实验结果,推进代码大语言模型隐私保护领域的研究。