数据集概述
本数据集为被动操作系统指纹识别方法评估构建,基于大学工作日约8小时的Web流量,通过Flowmon和GoFlows提取网络流特征,结合Web日志的User-Agent信息(经ua-parser转换为操作系统标签)标注。包含111个数据字段,涵盖基础流属性、IP/TCP参数、HTTP/TLS信息、数据包时序等,可用于操作系统指纹识别及相关网络分析。
文件详解
- 文件名称:
anonymized_flows.zip
- 文件格式:ZIP
- 字段映射介绍:包含111个数据字段,分为多类:
- 基础流属性:flow_ID、start、end、L3 PROTO、L4 PROTO、BYTES A、PACKETS A、SRC IP、DST IP等
- IP参数:IP ToS、maximumTTLforward、IPv4DontFragmentforward等
- TCP参数:TCP SYN Size、TCP Win Size、TCP SYN TTL、tcpOptionWindowScaleforward等
- HTTP信息:HTTP Request Host、URL
- 操作系统标签:UA OS family、UA OS major、UA OS minor等
- TLS信息:TLS_CONTENT_TYPE、TLS_SERVER_VERSION、TLS_JA3_FINGERPRINT等
- 数据包时序:NPM_ROUND_TRIP_TIME、NPM_JITTER_AVG_A、NPM_DELAY_HISTOGRAM等
- ICMP参数:ICMP TYPE
数据来源
大学网络流量(5台Web服务器,475个大学域名)、Microsoft IIS Web日志、Flowmon/GoFlows流导出工具、ua-parser工具
适用场景
- 操作系统指纹识别模型训练与评估: 利用标注的OS标签和网络流特征,开发或验证被动指纹识别算法
- 网络流量特征分析: 研究不同操作系统的网络行为模式(如TCP参数、TLS指纹差异)
- 网络安全监测: 基于OS指纹识别异常流量(如非预期操作系统的连接请求)
- 网络协议性能研究: 分析TLS/HTTP协议参数与操作系统的关联规律
- 用户设备类型统计: 基于OS分布数据,统计网络中用户设备(如Windows、Android、iOS)的占比情况