数据集概述
本数据集为“持续集成的持续代码质量结果实证研究”提供支撑,包含研究问题所需的所有数据及RQ3的小提琴图。涵盖项目分析数据、代码质量指标数据及可视化图表,支持对持续集成与代码质量关系的实证分析。
文件详解
- 可视化图表文件(PDF格式,共16个):
- ciactivity_duplicated_lines.pdf、ciactivity_bugs.pdf、cov_code_smells.pdf、ci_time_code_smells.pdf、ciactivity_code_smells.pdf、cov_duplicated_lines.pdf、ci_time_bugs.pdf等:呈现代码质量指标(重复行、缺陷、代码异味)与持续集成活动、时间、覆盖率等变量关系的小提琴图或相关图表
- 数据文件(CSV格式,共3个):
- RQ3_RQ4_DataSet.csv:支撑研究问题3和4的数据集
- analized_projecs_RQ1_RQ2.csv:研究问题1和2的项目分析数据,字段包含Project(项目名)、Start Using CI(开始使用CI时间)、Main Lang(主要语言)、Analized(分析结果)
- analized_dataset_RQ1_RQ2.csv:研究问题1和2的指标数据集,字段包含version(版本)、metric(指标类型)、date(日期)、value(指标值)、normalized_value(标准化值)、project_name(项目名)
适用场景
- 软件工程研究:分析持续集成实践对代码质量(缺陷、重复行、代码异味)的影响
- 持续集成效果评估:探究持续集成活动、时间、覆盖率与代码质量指标的关联
- 实证研究复现:支持对“持续集成的持续代码质量结果”相关研究结论的验证与扩展
- 软件质量改进:为开发团队优化持续集成流程、提升代码质量提供数据参考