数据集概述
本数据集是MSR 2024会议论文《How do Machine Learning Projects use Continuous Integration Practices? An Empirical Study on GitHub Actions》的复现包,包含研究分析所需的数据集、结果图表、R脚本及网络图谱构建说明,支持完整复现论文研究过程与结论。
文件详解
- 复现包文件
- 文件名称:ci-ml-msr-reproduction-package.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含四个核心目录:datasets(研究问题分析用数据集)、plots(研究结果图表)、r-script(分析脚本及指标计算脚本)、RQ3-neovis-network-graph(RQ3网络图谱构建说明)
数据来源
论文“How do Machine Learning Projects use Continuous Integration Practices? An Empirical Study on GitHub Actions”及GitHub仓库https://github.com/joaohelis/ml-ci-project-miner
适用场景
- 软件工程实证研究复现: 支持复现MSR 2024论文关于机器学习项目持续集成实践的研究结论。
- CI/CD实践分析: 分析机器学习项目在GitHub Actions中对持续集成实践的应用模式。
- 开源项目工程化研究: 探究机器学习开源项目的工程化水平与持续集成工具使用特征。
- 学术研究方法参考: 为软件工程领域实证研究提供复现包构建及数据分析的方法参考。