数据集

本地部署大语言模型漏洞URL提取测试结果数据集

数据集概述

本数据集记录了三款本地部署大语言模型（Llama 3.1: 8B、Qwen 2.5 Coder: 7B Instruct、Codestral: 22B）对选定漏洞样本的URL提取测试结果。数据按模型、CVE编号、漏洞ID层级组织，共包含四十八个文本文件，可直接关联原始漏洞样本。

文件详解

该数据集采用四级目录结构组织，具体说明如下： - 顶层目录: URL extraction results testing on-premise LLMs on selected exploits/ - 二级目录 (模型目录): - on-premise/codestral/: Codestral模型结果目录 - on-premise/llama3.1/: Llama 3.1模型结果目录 - on-premise/qwen2.5-coder/: Qwen 2.5 Coder模型结果目录 - 三级目录 (CVE编号目录): 如 CVE-2020-10199/，按漏洞编号分类 - 四级文件 (漏洞ID文件): 如 48343.txt，以ExploitDB或PacketStorm漏洞ID命名 - 文件格式: 所有文件均为TXT格式 - 文件内容: 每个TXT文件记录对应模型从指定漏洞代码中提取的URL输出结果

适用场景

大语言模型能力评估: 对比不同本地部署LLM在漏洞分析任务中的URL提取准确率
网络安全研究: 分析漏洞利用代码中URL访问模式与攻击链关联
模型优化: 为LLM在网络安全领域的微调提供真实漏洞场景测试数据
漏洞情报分析: 快速提取漏洞样本中的关键URL资源，辅助威胁情报构建

数据与资源

gbtjt9nk36-2.zipZIP
0.03 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.03 MiB
最后更新	2025年11月27日
创建于	2025年11月27日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。