数据集概述
本数据集由SpotFlow工具生成,基于15个Python库(包括gzip、calendar、json等)的测试套件分析。包含两个子数据集:运行时变量值数据集和测试用例与应用方法映射数据集,用于记录软件运行时的变量状态及方法调用关系。
文件详解
- 运行时变量值数据集
- 文件名称:var_values_dataset.json.zip
- 文件格式:ZIP压缩包(内含JSON文件)
- 字段映射介绍:记录15个Python库测试运行时的变量名称及对应值,包含一千二百三十四个 distinct变量和十三万三千一百六十九个 distinct值
- 测试用例与应用方法映射数据集
- 文件名称:mapping_dataset.json
- 文件格式:JSON
- 字段映射介绍:记录测试方法与所执行应用方法的映射关系,包含二千四百五十八个测试方法、四万二千二百一十八个应用方法,应用方法总计被执行二百七十二万二千七百四十六次
数据来源
SpotFlow工具(https://github.com/andrehora/spotflow)及15个Python库的测试套件
适用场景
- 软件动态分析研究:分析Python库运行时的变量状态变化和方法调用模式
- 测试用例有效性评估:基于方法调用覆盖情况,评估测试套件对应用代码的覆盖程度
- 软件行为理解:通过运行时数据,理解Python库内部方法的交互逻辑
- 动态程序分析工具验证:作为基准数据集,验证其他动态分析工具的准确性与完整性