基于大语言模型的代码异味识别实验复现包

数据集概述

本数据集是论文《AttentionSmelling:使用大语言模型识别代码异味》的复现包,聚焦GPT-4o对Java代码中三种关键代码异味(长方法、上帝类、特性羡慕)的检测能力,包含实验全流程的Jupyter笔记本、数据集参考及分析脚本,支持研究复现与扩展。

文件详解

该数据集包含4个文件,具体说明如下: - README.md:Markdown格式的说明文档,介绍复现包的核心内容、使用方法及实验背景。 - LICENSE:无扩展名的许可文件,规定复现包的使用权限与条款。 - artifact.rar:压缩文件,可能包含Jupyter笔记本、数据集及实验脚本等核心复现资源。 - paper.pdf:PDF格式的论文原文,提供实验设计、方法论及结果的详细背景。

适用场景

  • 软件工程研究:复现LLM检测代码异味的实验,验证不同提示词配置对检测性能的影响。
  • 代码质量分析:评估GPT-4o在Java项目中识别特定代码异味的效果与局限性。
  • 教育实践:作为教学资源,演示如何使用Jupyter构建代码异味检测的实验流程。
  • 大语言模型应用:研究LLM在软件工程领域的具体任务(如代码分析)中的优化方法。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.56 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。