Java_Unified_Bug_Based_软件开发缺陷数据集完整数据

数据集概述

该数据集是面向Java的统一缺陷数据集,通过整合现有公开源码指标缺陷数据集,统一源码指标计算逻辑,生成类和文件级别的统一数据,包含四万七千六百一十八个类元素和四万三千七百四十四个文件元素,支持缺陷预测模型构建与验证。

文件详解

  • 文件名称:UnifiedBugDataset-1.2.zip
  • 文件格式:ZIP(.zip)
  • 内容说明:压缩包形式的统一缺陷数据集,包含基于公共数据集重新计算统一源码指标后的类级和文件级数据,覆盖缺陷预测所需的源码指标与缺陷标签信息

适用场景

  • 软件缺陷预测研究:用于训练和验证基于决策树等算法的缺陷预测模型,支持项目内及跨项目缺陷预测分析
  • 源码指标标准化研究:分析不同缺陷数据集间指标定义、计算逻辑的差异及对预测结果的影响
  • 软件质量分析:探索源码指标与软件缺陷之间的关联,优化软件质量评估体系
  • 可重复性研究验证:为缺陷预测相关研究提供公开统一的基准数据集,提升研究结果的可重复性与可比性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 967.15 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。