数据集

网络钓鱼URL检测数据集-PhiUSIIL数据集

网络钓鱼URL检测数据集-PhiUSIIL数据集数据来源：互联网公开数据标签：网络安全,钓鱼,URL,恶意网址,机器学习,风险评估,网络钓鱼检测,安全研究数据概述： PhiUSIIL数据集是一个大型数据集，包含了134,850个合法URL和100,945个钓鱼URL。该数据集中的URL大多为最新URL。数据集从网页的源代码和URL中提取了特征，包括CharContinuationRate, URLTitleMatchScore, URLCharProb和TLDLegitimateProb等，这些特征都是从现有特征中衍生而来。关于该数据集的介绍性论文： PhiUSIIL: 基于相似度指数和增量学习的多元安全配置钓鱼URL检测框架，作者：Arvind Prasad和Shalini Chandra, 2024年发表于《计算机与安全》期刊。附加变量信息：可以忽略“FILENAME”列。类别标签：标签1对应合法URL，标签0对应钓鱼URL。数据用途概述：该数据集适用于网络钓鱼检测、URL分类、恶意网址识别等多种场景。研究人员可以利用此数据开发和评估机器学习模型，用于识别和拦截钓鱼网站。安全工程师可以利用此数据改进现有的安全防护系统，提高对钓鱼攻击的防御能力。此外，该数据集也适合用于网络安全教育和培训，帮助学习者了解钓鱼攻击的特征和识别方法。

数据与资源

网络钓鱼URL检测数据集-PhiUSIIL数据集.zipZIP
15.35 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	15.35 MiB
最后更新	2025年4月22日
创建于	2025年4月22日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

网络钓鱼URL检测数据集-PhiUSIIL数据集

数据与资源

附加信息

注册成功！