GitHub平台活跃用户画像数据集
数据来源:互联网公开数据
标签:GitHub, 用户, 社交网络, 开源, 开发者, 社区, 数据分析, 开发者画像
数据概述:
本数据集收录了超过15万名GitHub平台上的活跃用户,这些用户均拥有超过69个关注者。数据集包含了丰富的用户属性信息,旨在为研究者提供一个全面了解GitHub用户特征的资源。请注意,GitHub API的服务条款适用。
数据用途概述:
该数据集可用于多种研究和应用场景,包括:用户行为分析、开发者社区研究、开源项目参与者分析、社交网络分析、开发者画像构建等。研究人员可以利用该数据分析用户之间的关系、探讨开发者行为模式、评估开源项目的活跃度,以及识别潜在的合作机会。严禁将此数据集用于垃圾邮件目的,包括出售GitHub用户的个人信息,例如向招聘人员、猎头和求职网站出售。
字段定义:
login:用户的GitHub用户名或登录名,是平台上的唯一标识符。
avatar_url:用户个人资料图片的URL地址。
type:GitHub账户的类型,可以是"User"(个人用户)或"Organization"(组织),用于区分个人用户和团队或公司。
site_admin:布尔值,指示用户是否为GitHub组织的站点管理员。
name:用户的全名,如果用户在其GitHub个人资料中提供了。
company:用户当前或过去的工作单位或公司。
blog:用户关联的个人或专业博客的URL地址。
location:用户的地理位置,用户可能在其GitHub个人资料中指定。
email:用户的电子邮件地址,如果他们选择在GitHub上公开。
hireable:布尔值,指示用户是否开放招聘或正在寻找工作。
bio:用户在GitHub个人资料中提供的简短个人简介或描述,突出其兴趣或专业知识。
twitter_username:用户的Twitter用户名,如果他们已将其链接到GitHub个人资料。
public_repos:用户创建的公共仓库数量。
public_gists:用户创建的公共gist(代码片段)数量。
followers:关注此用户的GitHub用户数量。
following:此用户正在关注的GitHub用户数量。
created_at:用户GitHub账户的创建日期和时间。
updated_at:用户GitHub个人资料的最后更新或修改日期和时间。