数据集概述
本数据集包含以太坊智能合约代码弱点与漏洞特征的标注数据,覆盖CVE、SWC、Stack Overflow和GitHub四个数据源。通过专家标注明确漏洞类别,支持智能合约安全研究与分析,总计包含五个文件。
文件详解
- 标注数据文件(XML格式)
- 文件名称:
01_CVE_card_labeled_Final.xml、02_SWC_card_lebeled_Final.xml、03_StackOverflow_card_labeled_Final.xml、04_GitHub_card_labeled_Final.xml
- 文件格式:XML
- 字段映射介绍:以
为根节点,包含多个子节点;每个包含(搜索关键词)、(来源链接)、(附加标签)、(专家标注漏洞类别)、(第二专家标注,部分记录)、``(标注一致性)
- 说明文档
- 文件名称:
readme.md
- 文件格式:MD
- 内容介绍:数据集基本信息、作者及文件说明
数据来源
论文“A Fly in the Ointment: An Empirical Study on the Characteristics of Ethereum Smart Contracts Code Weaknesses and Vulnerabilities”
适用场景
- 区块链安全研究: 分析以太坊智能合约漏洞的类型分布与特征
- 智能合约漏洞检测: 为漏洞检测工具训练提供标注数据
- 漏洞分类体系优化: 对比CVE、SWC等不同分类标准的一致性
- 开发者社区安全分析: 研究Stack Overflow和GitHub中智能合约安全问题的讨论特征
- 标注一致性评估: 基于``分析专家标注的可靠性