找到93个数据集

标签: 代码质量

过滤结果
  • Smells_开源项目代码坏味道引入实证研究数据

    2026年2月9日 30 162 28

    数据集概述 本数据集围绕代码坏味道引入问题展开,基于200个开源项目的变更历史,通过识别坏味道引入提交、挖掘超50万次提交并手动分析9164次相关提交,探究开发者引入坏味道的时间、场景及原因,为代码质量优化提供实证依据。 文件详解 文件名称:smell-introduction.zip 文件格式:ZIP...
    packageimg
  • GitHub_Copilot_Based代码可验证性探索数据集

    2026年2月8日 30 109 45

    数据集概述 本数据集为“Exploring the Verifiability of Code Generated by GitHub Copilot”研究项目的配套数据,包含GitHub Copilot生成的Python代码实现,以及将其转换为Dafny语言并尝试验证的相关内容,用于研究代码生成工具的输出可验证性。 文件详解...
    packageimg
  • BugC_Based_C语言开源项目缺陷定位数据集

    2026年1月31日 30 114 23

    数据集概述 本数据集为BugC数据集,包含从GitHub提取的21个C语言开源项目,用于缺陷定位研究。共涵盖36,617条已关闭问题,其中2,462条通过拉取请求(pull-requests)解决,可作为缺陷定位的有效样本。数据集以压缩包形式提供,包含各项目的问题与拉取请求信息文件。 文件详解 文件名称:BuGC_Dataset.zip...
    packageimg
  • ESLint_Source_严格规则集完整规则数据

    2026年1月31日 30 207 205

    数据集概述 本数据集包含ESLint严格规则集(strict ruleset)中的所有规则信息,以结构化表格形式存储,为代码质量检查工具的规则分析提供基础数据支持。 文件详解 文件名称:strict_rules.xlsx 文件格式:XLSX...
    packageimg
  • GitHub_Based拉取请求模板使用情况调查数据

    2026年1月31日 30 190 171

    数据集概述 本数据集围绕GitHub平台上拉取请求模板的使用情况展开调查,包含原始数据及爬取脚本两类文件,可用于分析模板在代码协作中的应用现状,为开发流程优化提供参考。 文件详解 Pull_Request_Template_Data.zip 文件格式:ZIP 字段映射介绍:包含GitHub拉取请求模板使用情况调查的原始数据,具体内容需解压后查看...
    packageimg
  • AST_Based_流行代码仓库文件指标与问题数量数据集

    2026年1月30日 30 199 17

    数据集概述 本数据集包含流行代码仓库的抽象语法树(AST)分析衍生指标,以及与文件相关的问题数量。数据以JSON格式存储,结构为仓库名称下嵌套文件名称,每个文件包含文件级指标、类级指标及问题计数,为代码仓库的文件质量与问题关联分析提供结构化数据。 文件详解 文件名称:dataset.json 文件格式:JSON...
    packageimg
  • SWE_Bench_V2_0_软件工程基准测试解决方案数据

    2026年1月29日 30 148 39

    数据集概述 本数据集为SWE-Bench+ V2.0版本,是一个专注于软件工程领域的基准测试数据集。包含一个JSON格式文件,主要涉及软件工程解决方案的相关输出信息,可用于软件工程任务的评估与分析。 文件详解 文件名称:swe_solution_leak_outputs.json 文件格式:JSON...
    packageimg
  • GitHub_Copilot_TODO注释与提示工程关系评估数据

    2026年1月28日 30 136 124

    数据集概述 本数据集为论文“Are Prompt Engineering and TODO Comments Friends or Foes? An Evaluation on GitHub Copilot”的复现包,包含1个压缩文件,用于评估提示工程与TODO注释在GitHub Copilot中的作用关系,为AI代码助手的提示优化研究提供支持。...
    packageimg
  • TD_Temporality_技术债务引入时间性与影响因素分析数据

    2026年1月27日 30 175 109

    数据集概述 本数据集为技术债务(TD)引入时间性研究的配套数据,基于47个开源项目(来自Apache、Eclipse生态及GitHub独立项目),通过6个月滑动时间窗口分析新代码中TD问题的引入规律,以及开发团队工作量、开发者经验等因素与TD引入的关联。 文件详解 文件名称:SQJ2021.xlsx 文件格式:XLSX...
    packageimg
  • WoC_Based_MSR_2023挑战赛Bug修复提交研究复制包数据

    2026年1月23日 30 75 31

    数据集概述 本数据集是MSR 2023挑战赛提交论文“Studying Bug-Fixing Commits in the WoC Dataset”的复制包,包含Python和Java项目相关的Bug修复提交数据,共2个JSON文件,用于复现论文研究结果。 文件详解 Python项目数据文件 文件名称:PythonProjects.json...
    packageimg
  • AlphaCode_Based_竞争编程AI代码生成系统实证评估研究数据

    2026年1月22日 30 121 109

    数据集概述 本数据集为竞争编程AI系统AlphaCode的实证评估研究数据,包含AlphaCode生成的44份C++和Python代码,以及通过Codeforces API获取的31736份人类代码,用于对比两者的代码相似度、执行性能差异等核心指标,为AI代码生成技术的性能分析提供支持。 文件详解...
    packageimg
  • CMAPLE_SupplementaryData_系统发育推断工具测试数据

    2026年1月21日 30 187 172

    数据集概述 本数据集为CMAPLE系统发育推断工具的补充数据,包含用于基准测试、验证及代码质量评估的测试脚本与输入输出数据,支持对该工具在大流行时代应用场景下的性能分析。数据集仅包含一个压缩文件。 文件详解 文件名称:SupplementaryData.zip 文件格式:ZIP...
    packageimg
  • RESULT_Based_代码异味与人格类型关联研究数据_20231105

    2026年1月21日 30 43 1

    数据集概述 本数据集围绕“人格类型是否与代码异味相关”的研究主题,包含一个Excel格式文件,记录了相关研究的结果数据,用于探索人格类型与代码异味之间的潜在关联,为软件工程领域中代码质量影响因素的分析提供支持。 文件详解 文件名称:RESULT_20231105_0940.xlsx 文件格式:XLSX...
    packageimg
  • PROMISE_2015_Based_Python软件系统实证分析度量数据集

    2026年1月20日 30 9 8

    数据集概述 本数据集包含51个流行Python软件系统的度量数据,涵盖体积/大小、复杂度、面向对象三类共41项度量(文件、类、系统全局层面),以及14项系统元数据,旨在支持软件工程领域的实证研究,提升研究可重复性与效率。 文件详解 文件名称:promise2015_python_measurements-20150812.zip 文件格式:ZIP...
    packageimg
  • MSR_2019_Based_JavaScript代码片段规则违规挖掘数据集

    2026年1月20日 30 14 11

    数据集概述 本数据集为MSR 2019挖掘挑战赛的配套资源,包含从Google BigQuery获取的JavaScript代码片段原始数据、代码提取与ESLint检测脚本,以及规则违规统计结果。数据覆盖代码块内容、长度等基础信息,通过ESLint分析生成规则违规分类统计与单条报告,支持JavaScript代码质量相关研究。 文件详解 原始数据集文件...
    packageimg
  • React_Based_Dataset_React_Web系统代码异味检测研究数据

    2026年1月15日 30 176 141

    数据集概述 本数据集围绕React Web系统中的代码异味检测展开,包含一份整合了研究数据与灰色文献综述的文件,旨在为React项目的代码质量分析提供结构化参考资料,支持对React代码异味类型、分布及检测方法的研究。 文件详解 文件名称:Dataset and Grey Literature Review.xlsx 文件格式:XLSX...
    packageimg
  • Detecting_Code_Smells_React_Web应用代码异味检测数据集

    2026年1月18日 30 196 180

    数据集概述 本数据集包含用于检测React-based Web应用中代码异味的相关数据,共11个文件,均为.xlsx格式。涵盖多个React项目(如ant-design、grafana等)的代码异味检测结果及相关文献综述数据,为研究React应用代码质量提供支持。 文件详解 文件名称:superset.xlsx、ant-...
    packageimg
  • Kotlin_Refactoring_Detection_数据集与比较研究_补充材料

    2026年1月18日 30 118 55

    数据集概述 本数据集是论文《Extending Refactoring Detection to Kotlin: A Dataset and Comparative Study》的补充材料,包含2043个经人工验证的重构实例,覆盖21种重构类型,来自10个Kotlin仓库的200次提交。数据用于支持Kotlin重构检测的研究与工具比较。 文件详解...
    packageimg
  • Code_Smell_Detection_Based_开源项目代码异味检测方法综述数据集

    2026年1月18日 30 109 83

    数据集概述 本数据集是开源项目代码异味检测方法相关研究论文的综述总结,涵盖发表年份、数据集规模、项目数量、代码表示方式、质量属性、重构级别、预测类型、机器学习方法及评估指标等信息,为代码质量分析领域提供结构化参考。 文件详解 文件名称:Survey dataset.xlsx 文件格式:XLSX...
    packageimg
  • Refactorings_in_React_based_Web_Systems_研究数据集

    2026年1月17日 30 21 13

    数据集概述 本数据集源自《The Journal of Systems and Software》发表的React重构研究,通过分析320个开源项目的重构提交,梳理出69种重构操作,涵盖React特有、传统适配及JavaScript/CSS相关类型,为React应用可维护性提升提供实践参考,包含2个核心文件。 文件详解 README.txt...
    packageimg