数据集

基于大语言模型的代码异味识别实验复现包

数据集概述

本数据集是论文《AttentionSmelling：使用大语言模型识别代码异味》的复现包，聚焦GPT-4o对Java代码中三种关键代码异味（长方法、上帝类、特性羡慕）的检测能力，包含实验全流程的Jupyter笔记本、数据集参考及分析脚本，支持研究复现与扩展。

文件详解

该数据集包含4个文件，具体说明如下： - README.md：Markdown格式的说明文档，介绍复现包的核心内容、使用方法及实验背景。 - LICENSE：无扩展名的许可文件，规定复现包的使用权限与条款。 - artifact.rar：压缩文件，可能包含Jupyter笔记本、数据集及实验脚本等核心复现资源。 - paper.pdf：PDF格式的论文原文，提供实验设计、方法论及结果的详细背景。

适用场景

软件工程研究：复现LLM检测代码异味的实验，验证不同提示词配置对检测性能的影响。
代码质量分析：评估GPT-4o在Java项目中识别特定代码异味的效果与局限性。
教育实践：作为教学资源，演示如何使用Jupyter构建代码异味检测的实验流程。
大语言模型应用：研究LLM在软件工程领域的具体任务（如代码分析）中的优化方法。

数据与资源

15991616.zipZIP
2.56 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	2.56 MiB
最后更新	2025年12月6日
创建于	2025年12月6日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。