数据集概述
本数据集为科学开源软件(Sci-OSS)重构实证研究的复现数据包,包含研究所需的代码、依赖配置及工具调用脚本。核心内容围绕三种主流重构检测工具(PyRef、RefactoringMiner、RefDiff)在Sci-OSS中的有效性分析,涉及工具安装配置、GitHub数据下载及重构检测流程的复现说明。
文件详解
- 文件名称:replication package.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含Python项目代码、requirements.txt依赖配置文件、RQ1/scripts目录下的工具调用脚本(含download_data_from_github.py、pyref_script.py等),以及工具执行路径配置说明文件,支持重构检测工具的安装与数据处理流程复现。
适用场景
- 科学软件重构工具研究: 分析现有重构检测工具在Sci-OSS中的局限性,验证工具对领域知识依赖型重构的检测能力。
- 开源软件代码质量分析: 基于GitHub数据,研究Sci-OSS与非科学开源软件的重构行为差异。
- 软件工程实证研究复现: 复现科学软件重构检测工具有效性的实证分析流程,支持相关研究的验证与扩展。
- 工具优化需求分析: 识别Sci-OSS重构的特殊类型与挑战,为开发专用重构工具提供数据支撑。