数据集概述
本数据集为论文“A Context-Driven Approach for Co-Auditing Smart Contracts with The Support of GPT-4”的实验相关完整数据,包含实验代码、标注数据集、常见弱点枚举表、静态分析结果及说明文档等七份文件,覆盖智能合约审计实验的全流程资源,可用于验证上下文驱动的智能合约协同审计方法有效性。
文件详解
- 说明文档
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:包含实验前置依赖(如slither工具安装)、智能合约调用图生成的脚本执行步骤说明,以及call_graph.py脚本的使用指引(需在第12行插入智能合约名称生成函数调用代码)
- 代码文件
- 文件名称:call_graph.py
- 文件格式:PY
- 字段映射介绍:用于生成智能合约函数调用图的Python脚本,需按README指引配置智能合约名称
- 文件名称:functionCall.sh
- 文件格式:SH
- 字段映射介绍:用于执行智能合约调用图生成的Shell脚本,需传入智能合约路径参数运行
- 数据文件
- 文件名称:dataset-labeled.xlsx
- 文件格式:XLSX
- 字段映射介绍:标注后的智能合约数据集,用于实验训练或验证
- 文件名称:38 Common Weakness Enumeration.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含38项智能合约常见弱点枚举的表格数据
- 文件名称:results static analysis.xlsx
- 文件格式:XLSX
- 字段映射介绍:智能合约静态分析结果数据
- 代码文件
- 文件名称:selemiun_gpt_4_code_interpreter.ipynb
- 文件格式:IPYNB
- 字段映射介绍:结合Selenium与GPT-4的代码解释器相关Jupyter Notebook文件
数据来源
论文“A Context-Driven Approach for Co-Auditing Smart Contracts with The Support of GPT-4”
适用场景
- 智能合约审计方法验证: 用于验证基于GPT-4的上下文驱动协同审计方法对智能合约漏洞的检测效果
- 区块链安全工具开发: 基于call_graph.py等代码文件,开发或优化智能合约调用图生成工具
- 智能合约弱点研究: 利用常见弱点枚举表,分析智能合约典型漏洞特征与防御策略
- 大模型审计应用研究: 探索GPT-4在智能合约审计场景中的代码理解与漏洞识别能力
- 静态分析结果验证: 对比不同方法的智能合约静态分析结果,评估审计工具性能