数据集概述
本数据集是论文《Pitfalls and Guidelines for Using Time-Based VCS Data》的复制包,包含生成论文所有分析和结果的脚本、文本文件、JSON文件,以及记录论文调查结果和人工判断的电子表格。数据可用于复现论文研究结果,无需运行脚本即可获取缓存数据。
文件详解
- 压缩包文件
- 文件名称:dataset.zip
- 文件格式:ZIP
- 字段映射介绍:包含生成论文分析和结果的脚本、文本文件、JSON文件,脚本生成的数据已缓存为JSON或txt文件,无需运行脚本
- 电子表格文件
- 文件名称:Study on time data - prior work survey.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含论文的调查结果和人工判断数据
数据来源
GitHub仓库:https://github.com/psybers/emse21-timestudy
适用场景
- 论文结果复现: 用于复现论文《Pitfalls and Guidelines for Using Time-Based VCS Data》的分析过程和研究结果
- 时间序列版本控制系统数据研究: 基于复制包中的脚本和数据,开展时间序列版本控制系统数据使用的相关研究
- 软件工程方法论验证: 验证论文提出的时间序列版本控制系统数据使用陷阱与指南的有效性
- 调查结果分析: 基于电子表格中的调查结果和人工判断数据,开展相关统计分析和研究