代码变更质量问题识别与评审反馈分析数据集2024

数据集概述

该数据集为提交至ENASE 2024的论文配套数据,包含用于分析代码变更中常见质量问题的评审反馈数据,以及数据提取、预处理的Python脚本,支持对代码评审反馈与质量问题关联的研究。

文件详解

  • 数据文件:
  • Jabref_pullrequest_comments.xlsx: XLSX格式,可能包含JabRef项目的拉取请求评审反馈原始数据
  • Top Comments From JabRef Interpretted by Domain Expert.xlsx: XLSX格式,可能包含经领域专家解读的JabRef核心评审评论数据
  • topicStability Libreoffice_Updated.xlsm: XLSM格式,可能包含主题稳定性分析相关的LibreOffice表格数据(带宏)
  • 文档文件:
  • JabRef reflections by domain expert.pdf: PDF格式,可能包含领域专家对JabRef评审反馈的反思或分析报告
  • 代码文件:
  • python code.zip: ZIP格式压缩包,包含数据提取、预处理相关的Python脚本

适用场景

  • 软件工程研究: 分析代码评审反馈中反映的常见质量问题类型及分布
  • 代码质量优化: 探索基于评审反馈识别代码变更风险点的方法
  • 自然语言处理应用: 研究技术评审文本的语义分析与主题建模
  • 开源社区治理: 理解开源项目中评审机制对代码质量的影响路径
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 20.31 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。