TOSEM_Replication_基于GitHub拉取请求反应的实证研究复现包数据

数据集概述

本数据集是TOSEM论文《GitHub拉取请求反应的实证研究》的复现包,包含从GitHub平台前一万个星标最多的仓库及六个选定仓库(Cataclysm-DDA、Julia、Laravel、Node、RPCS3、Rust)收集的原始数据,以及用于数据收集、分析和论文图表生成的源代码,支持研究结果的完整复现。

文件详解

  • 文件名称:ReplicationV2.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含两类核心内容:一是从GitHub平台采集的原始数据集(覆盖前一万个高星仓库及六个选定仓库的拉取请求反应数据);二是配套源代码(用于数据收集、清洗分析及论文图表生成的程序文件)。具体文件结构与内容需解压后查看README.md获取详情。

数据来源

TOSEM论文《An Empirical Study on GitHub Pull Requests' Reactions》

适用场景

  • 开源软件开发协作分析:研究GitHub平台拉取请求的社区反应模式,洞察开发者协作行为与代码贡献反馈机制。
  • 实证研究复现:支持对论文结论的验证与扩展,为软件工程领域的相关研究提供可复现的数据集与分析工具。
  • 代码仓库数据挖掘:基于高星仓库的拉取请求数据,探索开源项目的维护效率与社区参与度特征。
  • 软件工程方法论优化:通过分析拉取请求反应规律,为开源项目的代码审查流程与协作规范提供改进依据。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 333.43 MiB
最后更新 2026年1月18日
创建于 2026年1月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。