恶意软件检测预测结果数据集

恶意软件检测预测结果数据集_Malware_Detection_Prediction_Results

数据来源:互联网公开数据

标签:恶意软件, 预测结果, 机器学习, 二元分类, 安全分析, 微软, 风险评估, 模型集成

数据概述: 该数据集包含来自微软恶意软件预测竞赛的预测结果,记录了对计算机系统是否感染恶意软件的概率预测。主要特征如下: 时间跨度:数据未明确标注时间,推断为特定时间段内的数据快照。 地理范围:数据源自全球范围内的计算机系统。 数据维度:数据集包括“MachineIdentifier”(机器唯一标识符)和“HasDetections”(是否检测到恶意软件的预测概率,0-1之间)。 数据格式:CSV格式,包含两个文件,分别是ens_sub_v12.csv和lgb_submission.csv,便于数据分析和模型评估。数据已进行匿名处理,包含预测结果,而非原始特征。 来源信息:数据来源于微软恶意软件预测竞赛,是参赛者提交的预测结果。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于机器学习模型性能评估、预测结果分析、模型集成策略研究等。 行业应用:为安全行业提供数据支持,可用于恶意软件检测模型的对比分析、风险评估等。 决策支持:支持安全团队评估不同检测模型的有效性,优化安全策略。 教育和培训:作为机器学习、数据科学课程的实训素材,用于模型评估、结果解读等。 此数据集特别适合用于分析不同预测模型的差异,评估模型集成效果,并深入理解恶意软件检测领域的预测结果。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 414.52 MiB
最后更新 2025年11月13日
创建于 2025年11月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。