数据集

LLM安全代码审查能力与影响因素研究复现包

数据集概述

本数据集是论文《LLM安全代码审查能力、障碍与影响因素研究》的复现包，包含三个核心文件夹，提供了LLM在安全代码审查任务中的性能测试数据、响应质量问题分析及影响因素研究的相关文件，支持研究结果的复现与验证。

文件详解

该数据集由三个核心文件夹组成，具体说明如下： - RQ1 Performance of LLMs文件夹： - Five prompt templates.pdf：PDF格式，展示五种提示词模板的详细结构。 - source code of the Python and C/C++ datasets：包含Python和C/C++数据集的源代码文件，用于构建提示词和基线工具静态分析。 - prompts for the Python and C/C++ datasets：基于五种模板构建的Python和C/C++数据集提示词文件。 - responses of LLMs and baselines：包含LLM响应结果和基线工具分析结果，其中CodeQL结果需上传sarif文件至GitHub查看，SonarQube结果需导入对应版本实例查看。 - entropy_calculation.py：Python脚本，计算LLM-提示词组合的平均熵以衡量响应一致性。 - Data Labelling for the C/C++ Dataset.xlsx：Excel格式，C/C++数据集的标注结果，包含LLM和基线工具响应的类别（工具性、有帮助、误导性、不确定）及文件ID、安全缺陷等字段。 - Data Labelling for the Python Dataset.xlsx：Excel格式，Python数据集的标注结果，结构与C/C++数据集标注文件一致。 - RQ2 Quality Problem in Responses文件夹： - data_analysis_first_round.mx22、data_analysis_second_round.mx22、data_analysis_third_round.mx22：MAXQDA项目文件，记录三轮实验中最佳LLM-提示词组合响应质量问题的提取结果，需用MAXQDA 2022及以上版本打开。 - RQ3 Factor influencing LLMs文件夹： - Step 1 - correlation analysis：包含Python脚本，用于解释变量的相关性分析。 - Step 2 - redundancy analysis and model fitting：包含R脚本及readme.md，用于冗余分析、自由度分配、模型拟合与评估，详细说明见readme.md。

适用场景

自然语言处理研究：分析LLM在安全代码审查任务中的提示词设计效果与响应一致性。
软件安全研究：探究LLM与传统静态分析工具在代码安全缺陷检测中的性能差异。
定性数据分析：基于MAXQDA文件研究LLM安全代码审查响应中的质量问题类型。
统计建模研究：利用相关性分析、冗余分析等方法验证影响LLM代码审查效果的关键因素。

数据与资源

15572151.zipZIP
143.83 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	143.83 MiB
最后更新	2025年12月18日
创建于	2025年12月18日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。