GitHub开发者社交网络用户属性与分类数据集-2019年6月

GitHub开发者社交网络用户属性与分类数据集-2019年6月 数据来源:互联网公开数据 标签:社交网络,GitHub,开发者,机器学习,Web开发,用户画像,节点分类,图数据 数据概述: 本数据集构建了一个大型的GitHub开发者社交网络,数据采集自2019年6月的GitHub公开API。网络中的节点代表至少star了10个仓库的开发者,边表示开发者之间的互粉关系。节点特征基于开发者的所在地、star的仓库数量、雇主信息以及电子邮件地址提取。

数据用途概述: 该数据集主要用于图神经网络、社交网络分析、用户行为分析等研究。具体应用场景包括:

  • 节点分类: 预测GitHub用户是Web开发者还是机器学习开发者。
  • 社交网络结构分析: 研究GitHub开发者社交网络的结构特性,如社区结构、中心节点等。
  • 用户画像构建: 基于节点特征,构建用户画像,分析不同类型开发者的行为模式。
  • 图神经网络训练: 用于图神经网络模型的训练与评估,探索图结构信息在用户分类中的应用。
  • 开发者关系研究: 分析开发者之间的关注关系,探索技术领域的合作与传播模式。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 12:16 (UTC)
创建于 四月 15, 2025, 12:16 (UTC)