函数级软件漏洞检测数据集

数据集概述

该数据集包含基于ARES'25论文规则预处理的函数级软件漏洞检测数据,以CSV格式存储,同时提供源代码压缩包。数据涵盖漏洞代码与补丁代码及其相关属性,如编程语言、CWE/CVE信息、提交记录等,为软件安全领域的漏洞检测研究提供结构化数据支持。

文件详解

  • 源代码压缩包:
  • vuln_patching_ares.zip: ZIP格式,包含相关源代码文件
  • 数据集文件(共6个CSV文件):
  • data_MegaVul_c.csv: CSV格式,字段包含cve_id、cwe_ids、cvss_vector、cvss_base_score等漏洞相关信息
  • data_Go.csv: CSV格式,字段包含index、vul_code、is_vulnerable、programming_language、method_name等17个属性
  • data_PHP.csv: CSV格式,字段结构参考data_Go.csv
  • data_MegaVul_c_23.csv: CSV格式,字段结构参考data_MegaVul_c.csv
  • data_CodeParrotGit_detection_Java.csv: CSV格式,仅包含部分核心字段(约3个)
  • data_VUL4J_patching_Java.csv: CSV格式,仅包含部分核心字段(约3个)

适用场景

  • 软件安全研究: 用于训练和评估函数级漏洞检测模型
  • 漏洞分析: 分析不同编程语言(Go、PHP等)的漏洞特征与修复模式
  • 代码审计: 构建自动化代码审计工具的测试数据集
  • 漏洞分类研究: 基于CWE/CVE信息开展漏洞类型分布与演化分析
  • 软件维护: 研究漏洞修复的提交模式与开发者行为特征
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 581.78 MiB
最后更新 2025年12月4日
创建于 2025年12月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。