钓鱼网站检测与识别URL数据集2014

钓鱼网站检测与识别URL数据集2014 数据来源:互联网公开数据
标签:钓鱼网站,URL,网络安全,特征工程,二分类,数据挖掘,机器学习

数据概述:
本数据集包含96,018条URL记录,其中48,009条为合法URL,48,009条为钓鱼网站URL。数据集以CSV文件形式存储,包含以下字段:
- "domain":每个URL的唯一标识符。
- "label":用于标识URL的类别,0表示合法URL,1表示钓鱼网站URL。
- 其他字段:包含用于钓鱼网站检测的特征值,具体内容参考相关研究论文。

数据用途概述:
该数据集适用于钓鱼网站检测与识别相关的研究和应用。研究人员可以利用此数据集进行特征工程和模型训练,探索高效的钓鱼网站检测算法。此外,数据集也适用于网络安全领域的学术研究和工业应用,为实时流数据分析和机器学习模型的评估提供支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 15:36 (UTC)
创建于 四月 14, 2025, 15:36 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。