cocommit_Based_开源软件开发者同步协作行为数据_2012

数据集概述

本数据集包含Apache软件基金会31个开源项目的开发者协作数据,采集于2012年3月24日。数据记录了开发者在Git仓库的提交活动(含开发者ID、文件信息、提交时间及代码行数变化)和邮件列表的通信活动(含收发件人ID及时间),并通过半自动化方法解决了开发者多别名问题。

文件详解

  • 文件名称:cocommit.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含两类核心数据字段
  • 提交活动字段:开发者ID、文件ID、文件类型、提交时间(秒级)、新增代码行数、删除代码行数
  • 通信活动字段:发送者ID、接收者ID、发送时间(秒级)

数据来源

论文“Building It Together: Synchronous Development in OSS”

适用场景

  • 开源软件协作机制研究: 分析开发者同步提交行为与项目生产力的关联
  • 分布式开发沟通模式分析: 探究开发者通信活动与代码提交的时间同步性
  • 开发者协作效率评估: 量化同步提交突发期对项目规模增长的影响
  • 开源项目管理优化: 基于协作数据改进分布式团队协调策略
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 11.02 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。