-
基于大语言模型的代码异味识别实验复现包
2025年12月6日 30 198 84
数据集概述 本数据集是论文《AttentionSmelling:使用大语言模型识别代码异味》的复现包,聚焦GPT-4o对Java代码中三种关键代码异味(长方法、上帝类、特性羡慕)的检测能力,包含实验全流程的Jupyter笔记本、数据集参考及分析脚本,支持研究复现与扩展。 文件详解 该数据集包含4个文件,具体说明如下: -...
-
开源静态分析工具与代码库告警类型频率评估数据集2025
2025年12月5日 30 108 70
数据集概述 本数据集包含复现与验证开源静态分析工具在多个开源代码库上生成告警频率分析所需的全部数据,涵盖工具运行指南、Docker配置文件、原始输出、解析脚本、处理后数据及关联CERT编码规则与CWE数据的增强数据。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称:...
-
AI辅助共开发与代码可维护性研究复现数据包
2025年12月4日 30 31 10
数据集概述 本数据集是研究“AI辅助共开发是否提升代码可维护性”的复现数据包,包含实验任务说明、参与者接收的源代码、因果分析图及匿名实验数据与分析脚本归档,支持对AI辅助工具影响代码可维护性的研究验证。 文件详解 文档文件(PDF格式): Task-1-instructions.pdf:第一阶段实验任务说明文档...



