DoH流量平衡数据集-恶意与良性网络流量分析-2020

DoH流量平衡数据集-恶意与良性网络流量分析-2020 数据来源:互联网公开数据 标签:DoH,网络流量,安全,机器学习,恶意软件,数据平衡,SMOTE,网络安全,加密流量 数据概述: 本数据集“BCCC-CIRA-CIC-DoHBrw-2020”旨在解决“CIRA-CIC-DoBre-2020”数据集中存在的类别不平衡问题。与“CIRA-CIC-DoBre-2020”数据集(约90%为恶意流量,10%为良性流量)不同,本数据集通过使用合成少数类过采样技术(SMOTE),实现了恶意和良性DoH(Domain over HTTPS,基于HTTPS的域名解析)网络流量的平衡。数据集包含恶意DoH流量和良性DoH流量,每类流量各有249,836个实例。本数据集由三个CSV文件组成:一个用于恶意DoH流量,一个用于良性DoH流量,还有一个文件整合了这两种类型的流量。 数据用途概述: 该数据集适用于网络安全研究、机器学习模型训练、恶意流量检测、DoH流量分析等多种场景。研究人员可以利用此数据训练和评估分类模型,以识别恶意DoH流量;安全工程师可以利用此数据改进网络安全防御系统;数据科学家可以探索不同的特征工程方法,提高恶意流量检测的准确性。此外,该数据集也适合用于教育和培训,帮助学习者理解DoH流量的特性,以及如何应对网络安全威胁。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 21:51 (UTC)
创建于 四月 14, 2025, 21:47 (UTC)