Design_Smells_Based_代码气味缺陷预测实验数据集

数据集概述

本数据集为论文《Exploring Design Smells for Smell-Based Defect Prediction》的支撑数据,包含两个研究问题(RQ1、RQ2)的实验结果。数据以压缩包形式存储,解压后分为RQ1和RQ2两个子目录,分别对应两个研究问题的实验配置与结果,覆盖97个分析项目,用于验证设计代码气味对缺陷预测模型性能的影响。

文件详解

  • 压缩包文件:
  • 文件名称:datasets.zip
  • 文件格式:ZIP
  • 解压后结构:包含RQ1、RQ2子目录及README.pdf说明文件
  • RQ1目录:
  • 子目录:configuration_1(10个最优分类器配置结果)、configuration_2(SVM最优配置结果)
  • 各配置子目录下分designite(设计气味)、designite_traditional(设计+传统气味)、traditional(传统气味)三个气味集子目录
  • RQ2目录:
  • 子目录:对应designite_traditional数据集中的4类设计气味,基于configuration_2配置构建
  • 项目子目录(共97个):
  • 包含dataset(原始训练测试数据)、oversamples(过采样训练数据)、score_summary(所有分类器配置得分)、scores.csv(主分类器得分)、selected_features(特征选择结果)、selected_testing_X(测试数据集)、top_scores_summary(Top10分类器配置得分)

数据来源

论文《Exploring Design Smells for Smell-Based Defect Prediction》

适用场景

  • 软件缺陷预测模型优化: 分析设计代码气味对传统缺陷预测模型性能的提升效果
  • 代码气味分类研究: 探究不同类别设计气味对缺陷预测模型的影响机制
  • 分类器配置性能评估: 对比不同分类器(如SVM)及特征集组合的缺陷预测效果
  • 软件质量分析: 基于97个项目的实验数据,研究代码气味与软件缺陷的关联关系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 41.1 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。