数据集概述
本数据集是期刊论文“Lightweight Dynamic Build Batching Algorithms for Continuous Integration”的实验复制包,包含持续集成构建批处理算法的实验数据、分析代码及结果验证文件,用于复现和验证轻量级动态构建批处理算法的性能与效果,总计47个文件。
文件详解
- 数据文件(.csv、.json)
- 文件名称:dataset_analysis.csv、ci_skipped_static_batching_duration.csv、std_dynbatch_brackets.csv、ci_skipped_dynamic_batching.csv、file_extensions.json等
- 文件格式:CSV、JSON
- 字段映射介绍:
- dataset_analysis.csv:包含project(项目)、total(总构建数)、passed(通过数)、failure_rate(失败率)、main_failure_rate(主分支失败率)等字段
- ci_skipped_static_batching_duration.csv:包含project(项目)、algorithm(算法)、batch_size(批大小)、total_duration(总时长)、time_saved(节省时间)等字段
- file_extensions.json:包含media、code、meta等文件类型分类的键值结构
- 代码文件(.py、.ipynb)
- 文件名称:batch_updation.py、new_batching_algs.py、projects.py、time-pivot.ipynb、verify-results.ipynb等
- 文件格式:Python脚本、Jupyter Notebook
- 内容介绍:包含批处理算法实现、数据处理脚本、实验结果分析与可视化代码
- 其他文件(.numbers)
- 文件名称:excel_median_calculations_cheatsheet.numbers、stat-times.numbers
- 文件格式:Numbers表格
- 内容介绍:包含中位数计算参考表、统计时间记录等辅助分析文件
数据来源
论文“Lightweight Dynamic Build Batching Algorithms for Continuous Integration”
适用场景
- 持续集成构建优化研究:分析动态批处理算法对构建时间、资源利用率的影响
- 软件工程实验复现:复现论文中轻量级动态构建批处理算法的实验结果与性能验证
- CI/CD效率提升分析:探究不同批处理策略在实际项目中的时间节省效果
- 软件构建数据挖掘:基于构建失败率、批大小等数据挖掘软件工程构建规律
- 算法性能对比:对比静态与动态批处理算法在不同项目中的构建优化表现