安卓恶意软件检测数据集

安卓恶意软件检测数据集 数据来源:互联网公开数据 标签:安卓,恶意软件,特征选择,权限,意图动作,机器学习,数据挖掘 数据概述: 本数据集由DroidRL提出,包含5000个良性样本和5560个恶意样本,分别来自AndroZoo和Drebin,用于训练和测试模型。数据集通过静态分析方法,从使用APKtool和Androguard反编译的安卓样本中提取权限、意图动作和操作码作为原始特征。每种类型的特征被构建为N维布尔向量,其中“1”表示该特征被使用,“0”表示未使用。每个样本最后附加一个标签,表示该样本是否为恶意安卓应用程序。 数据集选择了457个权限和126个意图动作作为原始特征向量的组成部分。权限信息表明应用程序需要访问哪些敏感用户数据(如联系人和短信),这对于安卓恶意软件检测至关重要。意图动作则是包含应用程序组件操作信息的抽象对象。通过反汇编class.dex生成smali文件,并使用正则表达式扫描smali文件中的方法字段来获取Dalvik字节码(例如:invoke-direct)。为解决由于N-gram数量增加导致的高维特征向量问题,采用了降维方法。 数据用途概述: 该数据集适用于恶意软件检测、特征选择、静态分析等多种场景。研究人员可以利用此数据集进行恶意软件检测模型的训练和测试;安全机构可以使用数据集识别和分析安卓恶意软件;开发者可以基于数据集优化应用程序的安全性。此外,数据集也适合用于教育培训,帮助学习者理解安卓安全和恶意软件检测的相关知识。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.16 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。