数据集概述
本数据集为两类依赖循环的实证研究数据,包含三个文件夹:recurring-patterns(成功解耦案例)、common-mistakes(未正确解决的依赖循环案例)、design-characteristics(循环文件的内部依赖关系及设计背景CSV文件)。数据集以压缩包形式提供,用于分析代码依赖循环的解耦模式、常见错误及设计特征。
文件详解
- 主文件:
two-class-cycle-untangling-empirical-data.zip
- 文件格式:ZIP
- 内容结构:包含三个子文件夹
- recurring-patterns:成功解耦案例,每个实例含src(提交前后代码)、cycle-dependency-change(提交前后循环文件依赖图)、all-modified-files-dependency-change(提交前后所有修改文件依赖图)、diff.txt(代码差异)、refactor.json(RefactoringMiner提取的重构操作)
- common-mistakes:未正确解决的依赖循环案例,文件结构同recurring-patterns
- design-characteristics:含1个CSV文件,记录循环文件的内部依赖关系及设计背景
适用场景
- 代码依赖循环解耦模式研究:分析recurring-patterns中成功解耦案例的重构操作与模式
- 软件重构错误分析:通过common-mistakes案例识别依赖循环解耦的常见错误类型
- 代码设计特征研究:利用design-characteristics中的CSV文件,探究循环文件的内部依赖及设计背景对依赖循环的影响
- 重构工具效果验证:基于refactor.json中RefactoringMiner提取的重构操作,验证工具在依赖循环解耦中的应用效果