网络钓鱼网址内容分析与识别数据集-aaditeypillai

网络钓鱼网址内容分析与识别数据集-aaditeypillai 数据来源:互联网公开数据 标签:网络钓鱼,URL,安全,威胁情报,机器学习,恶意网址,网络安全,数据分析 数据概述: 本数据集旨在支持网络钓鱼检测系统的研究与开发,包含了用于区分网络钓鱼网址和正常网址的多种特征。数据集包含两类URL:网络钓鱼URL(恶意网址,旨在欺骗用户)和正常URL(无害网址)。 关键特征包括: URL特征:域名、协议类型(HTTP/HTTPS)和基于IP的链接。 内容特征:链接密度、iframe存在情况、外部/内部链接以及元数据。 证书特征:SSL/TLS详细信息,如有效期和组织信息。 WHOIS数据:注册信息,如创建和过期日期。 数据集包含800个样本,其中网络钓鱼URL和正常URL各400个。共有22个特征,包括URL、域名、链接密度和SSL属性等。

数据用途概述: 该数据集适用于构建强大的网络钓鱼检测系统、增强电子邮件过滤和网页浏览的安全措施、以及培训网络安全从业人员识别恶意URL等场景。研究人员可以利用该数据集训练机器学习模型,从而提高对网络钓鱼攻击的检测能力。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 22, 2025, 18:56 (UTC)
创建于 四月 22, 2025, 18:56 (UTC)