-
TD_Temporality_技术债务引入时间性与影响因素分析数据
数据集概述 本数据集为技术债务(TD)引入时间性研究的配套数据,基于47个开源项目(来自Apache、Eclipse生态及GitHub独立项目),通过6个月滑动时间窗口分析新代码中TD问题的引入规律,以及开发团队工作量、开发者经验等因素与TD引入的关联。 文件详解 文件名称:SQJ2021.xlsx 文件格式:XLSX...
-
GitHub_Project_Based开源软件许可证分析数据集1_0
数据集概述 本数据集包含多组GitHub开源项目信息,覆盖PHP、Java、JavaScript、C、C++、C#、Python、Visual Basic八种编程语言。数据用于支持FOSSology Nomos、Ninka等许可证提取工具分析源代码中的开源软件许可证,同时可对项目README.md文件进行分析以发现库中使用的许可证。 文件详解...
-
CodeSmell_Based_C_长方法与大类代码异味人工标注数据集
数据集概述 本数据集包含采用C#编程语言编写的开源项目代码,针对长方法(Long Method)和大类(Large Class,文中亦称God Class)两种代码异味进行人工标注。每个标注实例由至少两名标注员独立完成,数据集包含标注结果及标注依据的启发式信息,共4个Excel文件,可用于代码异味检测模型训练与评估、代码质量分析等场景。 文件详解...
-
Fork_Including_Based开源软件开发分叉轨迹挖掘数据集
数据集概述 本数据集关联论文《Mining Fork-Including Development Traces》,包含880个Java开源项目的开发轨迹数据,涉及分叉相关的事件记录、项目信息及轨迹变体等内容,支持对分叉类型预测及用户参与度影响的分析。 文件详解 readme.txt(TXT格式):说明数据集关联的论文、作者及各文件内容概述。...
-
cocommit_Based_开源软件开发者同步协作行为数据_2012
数据集概述 本数据集包含Apache软件基金会31个开源项目的开发者协作数据,采集于2012年3月24日。数据记录了开发者在Git仓库的提交活动(含开发者ID、文件信息、提交时间及代码行数变化)和邮件列表的通信活动(含收发件人ID及时间),并通过半自动化方法解决了开发者多别名问题。 文件详解 文件名称:cocommit.zip 文件格式:ZIP...
-
数据集_组织与社区中敏捷变革的开放式方法_以开发开源项目为先导_初稿评审
数据集概述 本数据集为“组织与开源项目开发社区中敏捷变革的开放方法”研究的首评数据集,包含2000-2024年伞式综述的首评内容,核心目标是验证该时间段内无符合研究目标的已有综述,支持开源相关组织与社区的敏捷变革研究。 文件详解 文件名称:First Review.xlsx 文件格式:XLSX...
-
Atoms_of_Confusion_Java_开源项目混淆原子检测数据集
数据集概述 本数据集是Java程序中混淆原子的双重校验黄金标准数据集,从四个开源项目(FastUtil、Moshi、Jimfs、uCrop)的主源代码包中提取(排除测试文件),同时包含从Guava和Redisson两个开源项目中提取的样本数据,为Java代码混淆模式研究提供结构化参考。 文件详解 主文件 文件名称:Dataset.zip...
-
icpe17_Appendix_Java开源项目性能测试实践探索研究附录数据
数据集概述 本数据集是论文《An Exploratory Study of the State of Practice of Performance Testing in Java-Based Open Source Projects》的在线附录,包含支撑该研究的原始数据和补充材料,以压缩包形式提供,为理解Java开源项目性能测试实践现状提供补充信息。...
-
Software_test_smell_开发者经验对测试代码质量影响_研究数据
数据集概述 本数据集为开发者经验对软件测试代码质量影响的实证研究数据,聚焦测试坏味(test smells)的插入与移除情况。研究覆盖4个开源Java项目,包含386个测试类、5178个测试坏味,分析核心与外围开发者在测试坏味生成和消除中的作用,以及测试坏味在项目演化中的变化规律。 文件详解 文档文件 文件名称:Readme.docx...
-
Algorithm_Ownership_Based_代码所有权计算与分析工具数据
数据集概述 本数据集包含用于计算系统代码所有权的工具数据,基于GitHub平台挖掘的数据,旨在分析生成的结果。数据集仅包含一个压缩文件,未区分训练/测试集、数据/标签集或原始/处理数据。 文件详解 文件名称:algorithm-ownership.zip 文件格式:ZIP...
-
Detecting_Code_Smells_React_Web应用代码异味检测数据集
数据集概述 本数据集包含用于检测React-based Web应用中代码异味的相关数据,共11个文件,均为.xlsx格式。涵盖多个React项目(如ant-design、grafana等)的代码异味检测结果及相关文献综述数据,为研究React应用代码质量提供支持。 文件详解 文件名称:superset.xlsx、ant-...
-
Code_Smell_Detection_Based_开源项目代码异味检测方法综述数据集
数据集概述 本数据集是开源项目代码异味检测方法相关研究论文的综述总结,涵盖发表年份、数据集规模、项目数量、代码表示方式、质量属性、重构级别、预测类型、机器学习方法及评估指标等信息,为代码质量分析领域提供结构化参考。 文件详解 文件名称:Survey dataset.xlsx 文件格式:XLSX...
-
Refactorings_in_React_based_Web_Systems_研究数据集
数据集概述 本数据集源自《The Journal of Systems and Software》发表的React重构研究,通过分析320个开源项目的重构提交,梳理出69种重构操作,涵盖React特有、传统适配及JavaScript/CSS相关类型,为React应用可维护性提升提供实践参考,包含2个核心文件。 文件详解 README.txt...
-
RAW_to_ACES_Utility_Source_色彩科学光谱数据_2017
数据集概述 本数据集包含Dyer等人2017年发布的RAW to ACES Utility相关光谱数据,对应colour-science GitHub仓库中的特定版本数据。RAW to ACES Utility是将数码相机RAW文件转换为符合ACES规范容器文件的软件包,数据集仅提供该工具相关的光谱数据,不含其他类型文件。 文件详解...
-
NumFocus_Based_开源社区贡献者活动结构化数据集_2022_2024
数据集概述 本数据集记录NumFocus组织支持的58个开源项目在2022年1月至2024年12月期间的贡献者活动,包含271万余条细粒度操作记录(Actions)和228万余条高层任务记录(Activities),通过结构化抽象解决GitHub原始日志的分析难题,为开源协作行为研究提供标准化数据支持。 文件详解 操作数据集(Actions)...
-
meelgroup_ApproxCov_ApproxMaxCov算法评估基准数据集
数据集概述 本数据集包含用于评估ApproxCov和ApproxMaxCov算法及其扩展的基准测试数据,分为二值特征和多值特征两类配置系统约束与样本数据,支持算法性能验证与对比分析。 文件详解 文件名称:benchmarks.zip 文件格式:ZIP 字段映射介绍:压缩包包含三个子文件夹:...
-
Acceptance_Criteria_Based_验收标准实践创建与使用研究数据
数据集概述 本数据集包含2021年开展的验收标准实践研究相关材料,涵盖访谈研究问卷及开源项目用户故事验收标准评估数据,共2个文件,可用于分析软件开发中验收标准的实际应用情况。 文件详解 Questionnaire on the use and application of acceptance criteria.docx 文件格式:DOCX...
-
FASTTypescript_Based_TypeScript示例代码AST表示数据集
数据集概述 本数据集包含通过Pharo中的新项目FASTTypescript解析并表示为抽象语法树(AST)的Typescript示例代码。示例涵盖来自开源项目的小型、基础、复杂及超长代码,可用于研究Typescript代码结构及AST表示。 文件详解 文件名称:Typescript examples.xlsx 文件格式:XLSX...
-
Replication_Package_Based开源项目生存与废弃实证研究复制包数据
数据集概述 本数据集是开源项目生存与废弃实证研究的复制包,包含分析结果、原始数据、处理脚本及调研问卷答案,可复现和扩展论文研究结果。数据集共5个文件,涵盖开源项目生存状态相关的研究数据与分析工具。 文件详解 README.md 文件格式:MD...
-
Microservices_Issues_Empirical_Study_Dataset
数据集概述 本数据集是微服务系统问题、原因及解决方案实证研究的配套数据,记录于Excel文件中。包含15个开源微服务系统的筛选过程数据、问题原始数据、两轮筛选后的问题列表、初始编码、访谈与调查问卷及结果,以及问题、原因、解决方案的详细分类体系,支持微服务系统相关研究与分析。 文件详解 文件名称:Dataset.xlsx 文件格式:XLSX...



