JDT_Based_bug定位研究数据集

数据集概述

本数据集包含JDT项目的bug定位相关数据,由两个文件组成,分别为包含bug基础信息的电子表格和包含详细提交信息的XML文件。数据记录了bug报告与代码提交的关联信息,支持bug定位研究中对文本匹配与代码关联的分析。

文件详解

  • JDT.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含表格数据,字段有bug_id(缺陷编号)、summary(摘要)、description(描述)、time_reported(报告时间)、commit associated(关联提交)、status of commit(提交状态)、files committed(提交文件)
  • JDT.xml
  • 文件格式:XML
  • 字段映射介绍:包含上述表格所有信息,额外增加了commit associated对应的代码行信息(lines associated with the commit)

适用场景

  • bug定位技术研究:用于测试和优化bug报告与代码文件的匹配算法,解决词汇不匹配问题
  • 软件开发维护分析:分析bug修复的提交历史、文件修改模式,优化开发流程
  • 深度学习与信息检索融合研究:验证DNN与IR技术结合在bug定位任务中的互补效果
  • 软件缺陷管理:为项目bug管理提供数据支持,辅助开发者快速定位缺陷文件
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 15.57 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。