-
GitHub拉取请求数据丢失调查论文数据集
2025年12月23日 30 204 13
数据集概述 本数据集为论文《An Investigation into the Loss of Pull Request Data on GitHub》的配套数据,包含用于分析GitHub拉取请求(PR)数据丢失情况的程序文件、结果统计CSV文件及说明文档,支撑论文中8个研究问题(RQ1-RQ8)的分析与验证。 文件详解...
-
开发者与ChatGPT对话数据集2023
2025年12月22日 30 154 63
数据集概述 该数据集是经过整理的开发者与ChatGPT对话数据集,包含一万七千九百一十三条提示词及ChatGPT的回复(含一万一千七百五十一个代码片段),并关联了源代码、提交记录、问题、拉取请求、讨论及Hacker News帖子等软件开发工件,为分析开发者与ChatGPT交互的背景及影响提供支持。 文件详解 文件名称: DevGPT.zip 文件格式:...
-
NPM生态系统拉取请求接受预测数据集2020
2025年12月4日 30 43 38
数据集概述 该数据集包含470,925条NPM生态系统拉取请求数据及预训练随机森林模型,围绕技术与社会因素对拉取请求质量的影响展开,为预测拉取请求接受情况提供数据与模型支持,对应ESEM-2020相关研究论文。 文件详解 文件名称:Curated_Pull_Request_Data.csv 文件格式:CSV...
-
DroidLeaks_真实世界Android应用资源泄漏缺陷数据集
2025年12月15日 30 140 43
数据集概述 该数据集包含292个真实世界开源Android应用中的资源泄漏缺陷,涵盖流行且大规模的应用程序。每个缺陷提供代码仓库、资源类、缺陷代码版本、修复代码版本及相关报告或拉取请求(若有)的链接,为研究Android应用资源泄漏问题提供数据支持。 文件详解 文件名称:DroidLeaks.zip 文件格式:ZIP(压缩文件)...
-
科学工作流系统开发挑战实证研究论文附属数据集
2025年12月10日 30 106 9
数据集概述 本数据集是论文《An Empirical Investigation on the Challenges in Scientific Workflow Systems Development》的附属资料,围绕科学工作流系统(SWSs)的功能价值、开发角色及挑战展开,整合了从Stack...
-
开源GitHub项目代码审查回归分析数据集
2025年12月9日 30 106 49
数据集概述 该数据集包含用于研究“现代代码审查与开源项目安全性”的GitHub仓库数据,涵盖三千一百二十六个项目、一百四十三种语言,包含四十八万九千零三十八个问题和三十八万二千七百七十一个拉取请求,以及用于复现结果的回归分析代码文件。 文件详解 数据文件:...
-
COVID_19对开源开发活动影响的多方法研究补充材料
2025年12月8日 30 206 22
数据集概述 本数据集是关于COVID-19对开源开发活动影响的多方法研究补充材料,包含定量分析155个开源项目开发历史、定性调查核心开发者感知的相关文件,为理解疫情对软件工程领域的影响提供支持。 文件详解 README.pdf:PDF格式文档,可能包含数据集的基本说明、使用指南或研究背景介绍。 The Impact of COVID-19 on...
-
GitHub上AI编码代理研究数据集
2025年12月7日 30 17 7
数据集概述 该数据集围绕GitHub平台上的AI编码代理展开研究,包含与AI编码代理相关的各类结构化数据文件(Parquet格式)、说明文档及图片文件,为分析AI在软件工程中的应用提供数据支持。 文件详解 该数据集包含多种格式的文件,具体说明如下: - 说明文档类: - README.md: Markdown格式的说明文档,介绍数据集背景及使用方法 -...
-
开源项目协作模式对软件交付效率影响评估数据集
2025年12月7日 30 118 58
数据集概述 本数据集为论文《Evaluating the Impact of Collaboration Modes on Software Delivery Efficiency in Open-Source...
-
拉取请求属性与生命周期预测数据集
2025年12月6日 30 144 122
数据集概述 本数据集包含从GitHub上101个开源仓库提取的拉取请求数据,核心围绕拉取请求属性与生命周期预测的关联展开,涵盖人类及自动化提交的拉取请求信息,为研究影响拉取请求生命周期的关键因素提供数据支持。 文件详解 8199924.zip: 压缩文件格式,包含从GitHub开源仓库提取的拉取请求原始数据,具体字段需解压后查看。...
-
代码变更质量问题识别与评审反馈分析数据集2024
2025年12月5日 30 194 44
数据集概述 该数据集为提交至ENASE 2024的论文配套数据,包含用于分析代码变更中常见质量问题的评审反馈数据,以及数据提取、预处理的Python脚本,支持对代码评审反馈与质量问题关联的研究。 文件详解 数据文件: Jabref_pullrequest_comments.xlsx: XLSX格式,可能包含JabRef项目的拉取请求评审反馈原始数据...
-
GitHub每日拉取请求数据集GitHubDailyPullRequestsDataset-uddipta6
2025年4月24日 30 170 3
GitHub每日拉取请求数据集GitHubDailyPullRequestsDataset-uddipta6 数据来源:互联网公开数据 标签:软件开发,代码管理,数据集,GitHub,拉取请求,版本控制,开源社区,数据分析 数据概述: 该数据集包含来自GitHub平台每日拉取请求(Pull Requests,...
-
开源GitHub仓库星标-问题与拉取请求数据分析集-2011-mohammedmecheter
2025年4月21日 30 110 61
开源GitHub仓库星标-问题与拉取请求数据分析集-2011-mohammedmecheter 数据来源:互联网公开数据 标签:GitHub,开源项目,数据集,星标,问题,拉取请求,数据清理,时间序列,编程 数据概述: 本数据集包含了通过GitHub...



