数据集概述
本数据集是《重构波动性研究》论文的配套数据,包含48个项目的重构实例数据、研究问题(RQ1、RQ2、RQ4)的结果文件及分析脚本,支持实验复现与后续研究扩展。数据覆盖重构类型的统计结果、指标采集工具、样本数据集及原因分析示例,共5个文件。
文件详解
- Refactoring dataset.zip
- 文件格式:ZIP
- 字段映射介绍:包含48个项目的重构数据集,以JSON格式存储,涵盖807651个重构实例的具体数据。
- oddsRatioResults.csv
- 文件格式:CSV
- 字段映射介绍:包含RQ1的完整结果,字段为type(重构类型)、OR(优势比)、p_value(p值),涉及90种重构类型的统计分析数据。
- Rq2-datacollecting.py
- 文件格式:PY
- 字段映射介绍:RQ2使用的Python脚本,用于采集churn/history/experience维度的不同指标。
- sampling_result.json
- 文件格式:JSON
- 字段映射介绍:RQ4使用的样本数据集,用于分析重构波动性的原因。
- RQ4 - Reasons explaination(Pictures).zip
- 文件格式:ZIP
- 字段映射介绍:包含重构波动性不同原因的具体示例,含提交记录中重构代码变更的截图。
数据来源
论文“The Full Results and Dataset of Research of Refactoring Volatility”
适用场景
- 重构波动性研究:基于样本数据与结果文件,分析重构类型对波动性的影响及成因。
- 软件工程实证分析:利用重构实例数据与指标采集脚本,开展重构相关的实证研究。
- 统计方法应用验证:通过oddsRatioResults.csv中的OR值与p值,验证重构类型的统计显著性。
- 代码变更分析:借助RQ4的示例文件,研究重构代码变更的具体模式与波动性原因。
- 研究扩展支持:基于共享的重构数据集,开展重构领域的后续研究与数据扩展。