数据集概述
本数据集为Linux-APT-Dataset-2024,包含Linux环境下高级持续性威胁(APT)攻击的战术、技术与流程(TTPs)数据。涵盖2023年10月至2024年1月的17个CSV文件及1个XML文件,记录攻击模拟中的日志、MITRE TTP映射、文件哈希等关键信息,同时包含正常与恶意活动数据,支持网络安全分析与检测模型训练。
文件详解
- CSV数据文件(17个)
- 文件名称:如03-04-January.csv、01-05-October.csv等
- 文件格式:CSV
- 字段映射介绍:包含时间戳、Agent名称、完整日志(命令、 payload、参数)、MITRE战术与技术、文件哈希(MD5/SHA256)、源操作系统、路径、源数据类型、文件名、源日志、合规规则映射(PCI-DSS/HIPAA/NIST800-53)、IP与端口等字段;部分文件含索引、ID、版本、Agent IP、审计系统调用、文件信息、规则触发次数等扩展字段
- XML元数据文件
- 文件名称:local_rules.xml
- 文件格式:XML
- 字段映射介绍:包含本地规则配置相关元数据
数据来源
Karim, Sohaib (2024), “Linux-APT-Dataset-2024”, Mendeley Data, V1, doi: 10.17632/5x68fv63sh.1
适用场景
- APT攻击检测模型训练: 利用正常与恶意活动数据,训练Linux环境下APT攻击检测算法
- MITRE ATT&CK框架映射分析: 通过TTP标签关联MITRE战术与技术,研究APT攻击模式
- 网络安全日志分析: 解析攻击日志中的命令、payload及文件哈希,还原攻击流程
- 合规性审计: 基于PCI-DSS、HIPAA等规则映射,评估Linux系统安全合规性
- 数字取证研究: 利用完整日志与文件信息,模拟Linux系统攻击取证场景
- 漏洞利用分析: 研究数据集包含的Linux权限提升payload及最新CVE利用方式