数据集概述
本数据集包含51个流行Python软件系统的度量数据,涵盖体积/大小、复杂度、面向对象三类共41项度量(文件、类、系统全局层面),以及14项系统元数据,旨在支持软件工程领域的实证研究,提升研究可重复性与效率。
文件详解
- 文件名称:promise2015_python_measurements-20150812.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含51个Python软件系统的结构化数据,涵盖三类核心度量(体积/大小、复杂度、面向对象),覆盖文件、类、系统全局三个层级,同时包含14项系统元数据(如项目基本信息)
数据来源
论文“A Curated Benchmark Collection of Python Systems for Empirical Studies on Software Engineering”(Orrú等,2015)
适用场景
- 软件工程实证研究: 用于Python软件系统的质量评估、复杂度分析等实证研究,提升研究可重复性
- 软件度量模型验证: 验证体积/大小、复杂度等软件度量指标在Python项目中的有效性与相关性
- 开源软件质量分析: 分析流行Python开源系统的代码质量特征与演化规律
- 软件工程教育: 作为教学案例,帮助学生理解软件度量在实证研究中的应用
- 研究成本优化: 为相关领域研究提供现成的标准化数据集,减少数据收集与预处理成本