智能合约安全漏洞检测数据集SmartContractSecurityVulnerabilityDetectionDataset-hoangnahd
数据来源:互联网公开数据
标签:智能合约, 安全漏洞, 静态分析, 机器学习, 文本分析, 以太坊, 形式验证, 代码审计
数据概述:
该数据集包含来自以太坊智能合约的代码,记录了与安全漏洞相关的多种属性。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态代码快照。
地理范围:数据主要针对以太坊区块链上的智能合约,涵盖全球范围内的合约代码。
数据维度:包括“file_contents”(合约源代码)以及多个二元标签(Underflow, Overflow, TOD, AssertFail, CheckEffects, BlockTimestamp, LowlevelCalls),用于标识合约中是否存在特定的安全漏洞。
数据格式:数据以CSV和PKL两种格式提供,CSV文件包含合约源代码和漏洞标签,PKL文件可能包含用于模型训练和评估的预处理数据。文件命名规范为“eval_all.csv”、“train_all.csv”、“test_all.csv”等,分别对应评估集、训练集和测试集,并且有对应的.pkl文件。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于智能合约安全、程序分析、机器学习等交叉领域的学术研究,如漏洞检测算法开发、合约代码风险评估、安全漏洞成因分析等。
行业应用:为区块链安全行业提供数据支持,尤其适用于智能合约审计、安全漏洞扫描、形式化验证工具的开发与改进。
决策支持:支持区块链项目在上线前的安全评估,帮助开发者提升合约安全性,减少安全事故的发生。
教育和培训:作为区块链安全、智能合约开发等课程的实践素材,帮助学生和研究人员深入理解智能合约安全漏洞及其检测方法。
此数据集特别适合用于探索智能合约代码中的安全风险模式,训练机器学习模型,提高对智能合约安全漏洞的识别和预测能力,从而降低区块链应用的安全风险。