钓鱼网站检测URL特征数据集

钓鱼网站检测URL特征数据集 数据来源:互联网公开数据 标签:网络安全,钓鱼网站,URL特征,机器学习,数据挖掘,恶意网站,风险评估,计算机科学 数据概述: 本数据集旨在支持钓鱼网站检测研究,包含58,645个和88,647个被标记为合法或钓鱼网站的URL。数据集通过公共钓鱼网站和合法网站列表构建,提取了111个特征,其中96个来自URL本身,其余15个使用自定义Python代码提取。数据包含全球范围内的网站信息,旨在为钓鱼网站的分类模型提供训练和评估的依据。

数据用途概述: 该数据集主要用于机器学习和数据挖掘研究,尤其适用于构建和评估钓鱼网站检测模型。研究人员可以使用该数据集训练分类器,开发钓鱼网站检测系统,并进行关联规则挖掘。此外,该数据集也可用于构建防火墙、智能广告拦截器和恶意软件检测系统等。该数据集可以帮助研究人员和实践者轻松构建用于防止钓鱼攻击的分类模型,并作为开发最先进的机器学习方法进行钓鱼网站分类任务的性能基准。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 14:29 (UTC)
创建于 四月 14, 2025, 14:29 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。