数据科学核心库性能缺陷数据集

数据集概述

本数据集包含202个数据科学核心库中的性能缺陷,涵盖其影响、根本原因、定位与修复挑战及修复策略,支撑对数据科学库性能缺陷特征的实证研究,为开发者和用户提供参考。

文件详解

该数据集为一个ZIP压缩文件,包含三个核心文件夹,具体说明如下: - 压缩文件: - FSE_Datasets_PBs_in_DS_libs_01.zip: ZIP格式压缩包,包含研究复制所需的全部数据文件 - 核心文件夹内容: - RQ1&2_Impacts_and_Root_Causes: 包含性能缺陷的显性/隐性影响、症状及根本原因分类,文件中提供仓库名、问题编号、症状与根本原因标签 - RQ3_Root_Causes_Locating_Fixing_Effort_Challenge: 包含数据科学库性能缺陷定位与修复过程中的挑战分析 - RQ4_Fixing_Strategy: 包含小代码量修复策略的识别结果,文件中提供仓库名、问题编号及修复策略标签

适用场景

  • 软件工程研究: 分析数据科学库性能缺陷的特征、影响及修复策略
  • 数据科学生态优化: 为数据科学库开发者提供性能缺陷定位与修复的指导
  • 自动化工具开发: 基于小代码量修复策略开发性能缺陷自动修复工具
  • 实证研究复制: 支持对数据科学库性能缺陷实证研究的结果复现与扩展
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.2 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。