数据集概述
本数据集是论文“Fine Tuning Large Language Model for Secure Code Generation”的复现包,包含大语言模型微调所需的数据集及模型评估结果,用于支持安全代码生成方向的模型训练与性能验证研究,共包含3个文件。
文件详解
- README.md
- 文件格式:MD
- 字段映射介绍:提供复现包的说明文档,包含数据集和评估结果的存储路径及内容概述
- fine-tuning_dataset.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含用于大语言模型微调的训练数据集
- evaluation.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含模型评估结果,其中“generated_code”文件夹提供预训练模型和微调模型基于漏洞场景输入生成的代码文件
数据来源
论文“Fine Tuning Large Language Model for Secure Code Generation”
适用场景
- 大语言模型微调训练:用于安全代码生成方向的大语言模型微调训练
- 模型性能评估:基于评估结果分析微调后模型在安全代码生成任务上的性能提升
- 代码安全研究:通过生成代码的对比分析,探究大语言模型在漏洞场景下的代码生成能力
- 复现研究验证:支持其他研究者复现论文中的大语言模型微调实验与结果验证