全球开发者GitHub创新活动季度报告数据集-2020年1月至今

全球开发者GitHub创新活动季度报告数据集-2020年1月至今 数据来源:互联网公开数据 标签:GitHub, 开发者, 创新, 软件开发, 代码提交, 开源, 经济, 时间序列, 季度报告 数据概述: 本数据集收录了GitHub平台上的开发者创新活动季度报告,数据涵盖了自2020年1月至今的季度性指标。数据基于全球经济体进行聚合,每个经济体的指标仅在参与相关活动的独立开发者数量达到100人或以上时才会进行报告。

数据基于开发者与GitHub交互时的IP地址确定其所在位置。若开发者在报告期内更换地点,则其所有活动的位置将以该开发者在该期间内每日采样位置的众数确定。例如,如果开发者在美国贡献开源项目两个月,同时也在印度旅行期间进行了贡献,那么该开发者在该季度内的所有活动都将被归类到美国。此外,即使开发者在某天没有进行任何活动,也会沿用其最后已知位置。

数据包含以下指标:

Git 推送 (Git pushes):给定经济体内的开发者向GitHub上传代码的次数。 代码库 (Repositories):给定经济体内的软件项目数量,基于所有拥有triage及以上访问权限的存储库成员的位置众数确定。 开发者 (Developers):基于每日位置众数的给定经济体内的开发者账户数量。此计数不包括被内部系统标记为“垃圾”或机器人的用户。 组织 (Organizations):给定经济体内的开发者群体数量,包括公司、学术团体、非营利组织和在GitHub上组织活动的非正式集体。位置基于所有组织成员的位置众数确定。 编程语言 (Programming languages):在每个经济体中,至少向一个使用给定编程语言的存储库进行过一次git推送的独立开发者数量。 许可证 (Licenses):在每个经济体中,至少向一个带有给定许可证的存储库进行过一次git推送的独立开发者数量。数据中的NOASSERTION或Other(显示)表示找到了许可证文件,但无法高可信度地识别,或者存储库中存在多个许可证。 主题 (Topics):向一个带有给定主题的存储库进行过至少一次git推送的独立开发者数量。 经济体协作 (Economy collaborators):基于开发者向其他开发者或组织拥有的存储库发送的git推送和打开的拉取请求总和的软件项目协作量。

数据用途概述: 该数据集可用于分析全球软件开发趋势、不同经济体间的创新活动对比、开源生态系统发展研究、以及开发者行为模式分析等。研究人员可以利用此数据进行时间序列分析,了解不同经济体在软件开发领域的活跃程度和发展变化;政策制定者可以基于数据评估科技创新政策的有效性;投资机构可借助数据识别潜在的投资机会;教育机构可用于教学研究,帮助学习者理解全球软件开发的发展动态。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.09 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。