数据集概述
本数据集是TOSEM论文《GitHub拉取请求反应的实证研究》的复现包,包含从GitHub平台前一万个星标最多的仓库及六个选定仓库(Cataclysm-DDA、Julia、Laravel、Node、RPCS3、Rust)收集的原始数据,以及用于数据收集、分析和论文图表生成的源代码,支持研究结果的完整复现。
文件详解
- 文件名称:ReplicationV2.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含两类核心内容:一是从GitHub平台采集的原始数据集(覆盖前一万个高星仓库及六个选定仓库的拉取请求反应数据);二是配套源代码(用于数据收集、清洗分析及论文图表生成的程序文件)。具体文件结构与内容需解压后查看README.md获取详情。
数据来源
TOSEM论文《An Empirical Study on GitHub Pull Requests' Reactions》
适用场景
- 开源软件开发协作分析:研究GitHub平台拉取请求的社区反应模式,洞察开发者协作行为与代码贡献反馈机制。
- 实证研究复现:支持对论文结论的验证与扩展,为软件工程领域的相关研究提供可复现的数据集与分析工具。
- 代码仓库数据挖掘:基于高星仓库的拉取请求数据,探索开源项目的维护效率与社区参与度特征。
- 软件工程方法论优化:通过分析拉取请求反应规律,为开源项目的代码审查流程与协作规范提供改进依据。