网络钓鱼URL检测数据集PhishingURLDetectionDataset-mohammedsemry
数据来源:互联网公开数据
标签:网络钓鱼, URL, 安全, 恶意软件, 机器学习, 数据挖掘, 文本分析, 安全威胁
数据概述:
该数据集包含来自网络安全社区的数据,记录了用于识别网络钓鱼攻击的URL样本。主要特征如下:
时间跨度:数据记录的时间范围主要集中在2021年。
地理范围:数据为全球网络安全场景下的钓鱼URL示例。
数据维度:包括“phish_id”(钓鱼ID),“url”(钓鱼URL),“phish_detail_url”(钓鱼详情URL),“submission_time”(提交时间),“verified”(是否验证),“verification_time”(验证时间),“online”(是否在线),“target”(攻击目标)等字段。
数据格式:CSV格式,包含phishing.csv和pone.0258361.s002.csv两个文件,便于数据分析和建模。其中,phishing.csv包含多个未命名的列,需进行数据清洗。pone.0258361.s001.arff是另一格式的数据文件。
该数据集适合用于网络钓鱼URL的检测和分析,以及安全威胁评估和防御策略研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于网络安全、恶意软件分析等领域的学术研究,如钓鱼URL的特征提取、恶意URL检测模型的构建等。
行业应用:为信息安全行业提供数据支持,尤其适用于入侵检测系统(IDS)、安全情报分析、威胁情报共享等。
决策支持:支持企业和组织的网络安全风险评估、安全策略制定和安全态势感知。
教育和培训:作为网络安全课程的实训数据,帮助学生和研究人员理解钓鱼攻击的模式和防御方法。
此数据集特别适合用于探索钓鱼URL的特征与演变规律,以及构建有效的钓鱼URL检测模型,从而提升网络安全防御能力。