LLMs4Code_Machine_Unlearning_敏感信息泄露缓解研究数据集与源码

数据集概述

本数据集是论文《Mitigating Sensitive Information Leakage in LLMs4Code through Machine Unlearning》的配套资源,包含研究所需的数据集和源码,压缩为单个ZIP文件。数据集存储于"数据"文件夹,推理结果位于"推理结果"文件夹,运行说明可参考"readme.md"文件,支持复现论文中的大语言模型代码敏感信息泄露缓解研究。

文件详解

  • 文件名称:Mitigating Sensitive Information Leakage in LLMs4Code through Machine Unlearning.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含两类核心内容,一是存储于"data"文件夹的研究数据集,二是存储于"infer result"文件夹的推理结果文件,同时提供"readme.md"文件说明代码运行方法,无明确字段映射信息。

数据来源

论文"Mitigating Sensitive Information Leakage in LLMs4Code through Machine Unlearning"

适用场景

  • 大语言模型代码安全研究: 复现LLMs4Code中敏感信息泄露的缓解实验,分析机器学习遗忘技术的有效性。
  • 代码生成模型隐私保护: 探索代码领域大语言模型的敏感信息泄露机制与防护方法。
  • 机器学习遗忘技术验证: 验证机器遗忘技术在代码大语言模型中的应用效果与性能影响。
  • 学术研究复现: 支持其他研究者复现论文实验结果,推进代码大语言模型隐私保护领域的研究。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.82 MiB
最后更新 2026年1月12日
创建于 2026年1月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。