数据集

网络钓鱼URL检测数据集PhishingURLDetectionDataset-shag2003

数据来源：互联网公开数据

标签：网络安全, 钓鱼检测, URL分析, 机器学习, 特征工程, 二分类, 网页安全, 风险评估

数据概述：该数据集包含从网络爬虫和公开资源收集的URL数据，用于识别网络钓鱼网站。主要特征如下：时间跨度：数据未明确标注时间范围，可视为一个静态数据集。地理范围：数据来源于全球范围内的网络钓鱼和合法网站。数据维度：数据集包含24个特征，涵盖URL、HTML标签、域名相关信息以及页面内容等，并附带一个“status”字段，用于标记URL是“legitimate”（合法）还是“phishing”（钓鱼）。数据格式：CSV格式，文件名为Preprocessed_data.csv，方便数据分析和建模。来源信息：数据经过预处理，包含了从原始URL中提取的各种特征，并进行了标签标注。该数据集适合用于网络钓鱼检测模型构建和安全风险评估。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于网络安全、机器学习等领域的学术研究，如钓鱼网站识别算法的改进、特征重要性分析等。行业应用：可为安全软件、浏览器厂商、在线服务提供商等提供数据支持，用于构建钓鱼网站检测系统，提升用户安全防护能力。决策支持：支持安全团队进行风险评估和威胁情报分析，从而制定更有效的安全策略。教育和培训：可作为网络安全课程的实训数据集，帮助学生和研究人员理解钓鱼攻击的特征，并学习构建相关检测模型。此数据集特别适合用于探索URL特征与钓鱼行为之间的关联，帮助用户构建和优化钓鱼网站检测模型，提高网络安全防护水平。

数据与资源

网络钓鱼URL检测数据集PhishingURLDetectionDataset-shag2003.zipZIP
0.18 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.18 MiB
最后更新	2025年5月7日
创建于	2025年5月7日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

网络钓鱼URL检测数据集PhishingURLDetectionDataset-shag2003

数据与资源

附加信息

注册成功！