基于机器学习的电子医疗记录系统网络事件检测数据集

数据来源：互联网公开数据

标签：网络安全, 电子医疗记录, 网络事件检测, 异常检测, 机器学习, 医疗数据

数据概述：

本数据集用于基于机器学习的电子医疗记录（Electronic Medical Record, EMR）系统网络事件检测研究，重点关注医疗数据的保密性和可用性。数据集包含正常记录和异常记录，旨在模拟真实医疗环境中的数据状态，供网络安全分析和异常检测算法的开发与验证使用。

正常数据集（Normal）：包含16,164名患者的基本信息，如姓名、地址、出生日期、性别、种族、族裔等。这些数据代表了正常的医疗记录，无任何异常或篡改迹象。
异常数据集（Anomaly）：包含36,447名患者的数据，这些数据模拟了潜在的网络事件或数据篡改情况，例如敏感信息泄露、数据被篡改或未经授权访问等。
综合数据集（Combined）：将正常数据集和异常数据集合并，形成一个包含68,775名患者的综合数据集。其中，包含2倍的正常记录和1倍的异常记录，用于构建更加复杂的分析场景。

数据集中的每条记录都包含患者的基本信息字段，具体字段包括但不限于：姓名、地址、出生日期、性别、种族、族裔等，以模拟真实的医疗记录结构。此外，异常数据集通过人为添加异常特征，模拟网络攻击或数据篡改行为，为机器学习模型的训练和评估提供支持。

数据用途概述：

该数据集适用于以下场景：

此数据集的公开发布，为医疗信息安全领域的研究和实践提供了重要支持，有助于推动基于机器学习的网络安全技术在医疗行业的应用与发展。

数据与资源

字段	值
版本	1.0
数据集大小	19.24 MiB
最后更新	2025年4月27日
创建于	2025年4月27日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。