数据集概述
本数据集记录了GitHub平台上330条测试相关的代码评审数据,包含40个评审建议、16个请求类别、8个响应类别,以及13个拉取请求和评论特征。数据集通过结构化字段整合了项目信息、评审内容、测试类型等维度,为分析开发者测试评审行为提供支持。
文件详解
- 文件名称:Test Reviews v1.csv
- 文件格式:CSV
- 字段映射介绍:包含Project Owner(项目所有者)、Project Repo(项目仓库)、Project URI(项目统一资源标识符)、Project Language(项目语言)、Pull Request URI(拉取请求统一资源标识符)、Pull Request ID(拉取请求ID)、Pull Request Author(拉取请求作者)、Pull Request Merge Commit Hash(拉取请求合并提交哈希)、Review comment URI(评审评论统一资源标识符)、Review comment ID(评审评论ID)、Review comment Text(评审评论文本)、Solving Commit Hash(解决提交哈希)、Solving Commit URI(解决提交统一资源标识符)、Validation(验证)、Request Category(请求类别)、Tips(建议)、Response Category(响应类别)、Test Case(测试用例)、Unspecified(未指定)、Test Method(测试方法)、Fix SUT(修复被测系统)、Optional Test(可选测试)、Improve Test(改进测试)、Refactor Test(重构测试)、Test Class(测试类)、Fix Test(修复测试)、Test Branch(测试分支)、Test Statement(测试语句)、Achieve Specific Coverage Goal(达成特定覆盖率目标)、ML Model Test(机器学习模型测试)、Prevent Exploit(防止漏洞利用)、Disagreement(分歧)、Revert Test Removal(恢复测试移除)、Unit Test(单元测试)、Code Snippet(代码片段)、End-to-End Test(端到端测试)、Edge Case(边界用例)、Expected Exception(预期异常)、Filepath(文件路径)、Set Up(设置)、Parametric(参数化)、Negative Test(负面测试)、Test Double(测试替身)、Type Support(类型支持)、Based On(基于)、External Resource(外部资源)、Integration Test(集成测试)、Positive Test(正面测试)、Avoid Wrong API Usage(避免错误API使用)、Increase Testability(提高可测试性)、Rename Test(重命名测试)、Dependency(依赖)、Reproduce Issue(复现问题)、More Specific Test(更具体的测试)、Event Test(事件测试)、Assert Message(断言消息)、Fix Based On Test(基于测试修复)、Boundary Test(边界测试)、Regression Test(回归测试)、Async(异步)、Thread(线程)、Consistency Test(一致性测试)、Move Test(移动测试)、Compilation Check(编译检查)、Extract Member(提取成员)、Cache(缓存)、Modifier(修饰符)、Empty Test File(空测试文件)、Merge Test(合并测试)、Readability(可读性)、Sleep(休眠)、Invalid Test(无效测试)、Remove Reflection(移除反射)等字段
- 文件名称:Test Reviews v1.xlsx
- 文件格式:XLSX
- 字段映射介绍:与CSV文件字段一致,包含上述所有结构化字段
- 文件名称:Test Reviews v1.ods
- 文件格式:ODS
- 字段映射介绍:与CSV文件字段一致,包含上述所有结构化字段
适用场景
- 软件开发测试评审行为分析: 研究开发者在GitHub上对测试相关拉取请求的评审模式、建议类型和响应特征
- 测试质量改进研究: 分析评审中提出的测试改进方向(如重构测试、修复测试、提高可测试性等),为测试实践优化提供参考
- 代码评审流程优化: 基于拉取请求和评论特征,探索提升测试评审效率的方法
- 开发者协作模式研究: 挖掘评审中的分歧、响应类别等维度,分析开发者在测试评审场景下的协作行为
- 测试类型分布分析: 通过Test Case、Test Method、Unit Test等字段,统计不同测试类型在实际项目中的应用情况