GitHub上AI编码代理研究数据集

数据集概述

该数据集围绕GitHub平台上的AI编码代理展开研究,包含与AI编码代理相关的各类结构化数据文件(Parquet格式)、说明文档及图片文件,为分析AI在软件工程中的应用提供数据支持。

文件详解

该数据集包含多种格式的文件,具体说明如下: - 说明文档类: - README.md: Markdown格式的说明文档,介绍数据集背景及使用方法 - README.pdf: PDF格式的说明文档,内容与README.md一致 - 结构化数据文件(Parquet格式): - user.parquet: 用户相关数据 - all_pull_request.parquet: 所有拉取请求数据 - related_issue.parquet: 相关问题数据 - pr_reviews.parquet: 拉取请求评审数据 - pr_commits.parquet: 拉取请求提交记录数据 - pr_commit_details.parquet: 拉取请求提交详情数据 - human_pull_request.parquet: 人类发起的拉取请求数据 - 图片文件(PNG格式): - pr_cumulative.png: 拉取请求累积趋势图 - aidev_logo.png: 项目标志图片 - dataset_schema.png: 数据集结构示意图

适用场景

  • 软件工程研究: 分析AI编码代理在GitHub平台的实际应用表现
  • AI辅助开发工具评估: 研究AI编码代理对软件开发效率的影响
  • 开源社区协作模式分析: 对比AI与人类在代码贡献中的行为差异
  • 代码评审机制研究: 探索AI编码代理生成代码的评审反馈特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 670.36 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。