数据集概述
本数据集为论文《Exploring Design Smells for Smell-Based Defect Prediction》的支撑数据,包含两个研究问题(RQ1、RQ2)的实验结果。数据以压缩包形式存储,解压后分为RQ1和RQ2两个子目录,分别对应两个研究问题的实验配置与结果,覆盖97个分析项目,用于验证设计代码气味对缺陷预测模型性能的影响。
文件详解
- 压缩包文件:
- 文件名称:datasets.zip
- 文件格式:ZIP
- 解压后结构:包含RQ1、RQ2子目录及README.pdf说明文件
- RQ1目录:
- 子目录:configuration_1(10个最优分类器配置结果)、configuration_2(SVM最优配置结果)
- 各配置子目录下分designite(设计气味)、designite_traditional(设计+传统气味)、traditional(传统气味)三个气味集子目录
- RQ2目录:
- 子目录:对应designite_traditional数据集中的4类设计气味,基于configuration_2配置构建
- 项目子目录(共97个):
- 包含dataset(原始训练测试数据)、oversamples(过采样训练数据)、score_summary(所有分类器配置得分)、scores.csv(主分类器得分)、selected_features(特征选择结果)、selected_testing_X(测试数据集)、top_scores_summary(Top10分类器配置得分)
数据来源
论文《Exploring Design Smells for Smell-Based Defect Prediction》
适用场景
- 软件缺陷预测模型优化: 分析设计代码气味对传统缺陷预测模型性能的提升效果
- 代码气味分类研究: 探究不同类别设计气味对缺陷预测模型的影响机制
- 分类器配置性能评估: 对比不同分类器(如SVM)及特征集组合的缺陷预测效果
- 软件质量分析: 基于97个项目的实验数据,研究代码气味与软件缺陷的关联关系