Refactoring_Volatility_Research_完整结果与数据集

数据集概述

本数据集是《重构波动性研究》论文的配套数据,包含48个项目的重构实例数据、研究问题(RQ1、RQ2、RQ4)的结果文件及分析脚本,支持实验复现与后续研究扩展。数据覆盖重构类型的统计结果、指标采集工具、样本数据集及原因分析示例,共5个文件。

文件详解

  • Refactoring dataset.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含48个项目的重构数据集,以JSON格式存储,涵盖807651个重构实例的具体数据。
  • oddsRatioResults.csv
  • 文件格式:CSV
  • 字段映射介绍:包含RQ1的完整结果,字段为type(重构类型)、OR(优势比)、p_value(p值),涉及90种重构类型的统计分析数据。
  • Rq2-datacollecting.py
  • 文件格式:PY
  • 字段映射介绍:RQ2使用的Python脚本,用于采集churn/history/experience维度的不同指标。
  • sampling_result.json
  • 文件格式:JSON
  • 字段映射介绍:RQ4使用的样本数据集,用于分析重构波动性的原因。
  • RQ4 - Reasons explaination(Pictures).zip
  • 文件格式:ZIP
  • 字段映射介绍:包含重构波动性不同原因的具体示例,含提交记录中重构代码变更的截图。

数据来源

论文“The Full Results and Dataset of Research of Refactoring Volatility”

适用场景

  • 重构波动性研究:基于样本数据与结果文件,分析重构类型对波动性的影响及成因。
  • 软件工程实证分析:利用重构实例数据与指标采集脚本,开展重构相关的实证研究。
  • 统计方法应用验证:通过oddsRatioResults.csv中的OR值与p值,验证重构类型的统计显著性。
  • 代码变更分析:借助RQ4的示例文件,研究重构代码变更的具体模式与波动性原因。
  • 研究扩展支持:基于共享的重构数据集,开展重构领域的后续研究与数据扩展。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 72.88 MiB
最后更新 2026年1月19日
创建于 2026年1月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。