数据集

恶意软件检测特征数据集

恶意软件检测特征数据集_Malware_Detection_Feature_Dataset

数据来源：互联网公开数据

标签：恶意软件, 安全分析, 机器学习, 特征工程, 二分类, 文件分析, 静态分析, 安全研究

数据概述：该数据集包含来自恶意软件样本的静态分析特征，记录了用于识别恶意软件的关键属性。主要特征如下：时间跨度：数据未标明具体时间，视作静态特征数据集使用。地理范围：数据样本来源未明确标注，可推测为全球范围内的恶意软件样本。数据维度：包括多个文件特征，如： sha256: 文件的 SHA256 哈希值。 md5: 文件的 MD5 哈希值。 numstrings: 文件中字符串的数量。 printables: 文件中可打印字符的数量。 entropy: 文件的熵值。 paths: 文件中包含的路径。 urls: 文件中包含的 URL。 registry: 文件中涉及的注册表项。 MZ: 文件是否为可执行文件（PE文件）。 size: 文件大小。 vsize: 文件的虚拟大小。 has_debug: 是否包含调试信息。 has_relocations: 是否包含重定位信息。 has_resources: 是否包含资源。 has_signature: 是否包含数字签名。 has_tls: 是否包含线程局部存储。 symbols: 包含的符号信息。 subsystem: 文件的子系统类型。 major_image_version, minor_image_version, major_operating_system_version, minor_operating_system_version: 镜像版本和操作系统版本信息。 sizeof_code: 代码段大小。 sizeof_headers: 头部大小。 entry: 入口点。 imports: 导入的函数。 exports: 导出的函数。数据格式：提供CSV格式，包含train_dataset.csv, test_dataset.csv和sample.csv，便于数据分析和建模。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于恶意软件分析、安全研究、二进制文件分析等领域的学术研究，如恶意软件检测算法的评估、特征重要性分析等。行业应用：为安全行业提供数据支持，可用于构建恶意软件检测模型，例如入侵检测系统（IDS）、端点检测和响应（EDR）等。决策支持：支持安全团队进行威胁情报分析、恶意软件家族识别，以及制定相应的安全防护策略。教育和培训：作为信息安全、机器学习等相关课程的实训数据，帮助学生和研究人员理解恶意软件特征和检测技术。此数据集特别适合用于构建和评估恶意软件检测模型，并探索不同特征对检测性能的影响，从而提升对恶意软件的识别能力。

数据与资源

恶意软件检测特征数据集_Malware_Detection_Feature_Dataset.zipZIP
471.55 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	471.55 MiB
最后更新	2025年9月11日
创建于	2025年9月11日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

恶意软件检测特征数据集

数据与资源

附加信息

注册成功！