数据集概述
本数据集包含德国三级医疗中心Klinikum Lippe Detmold收集的匿名常规实验室数据,仅保留全血细胞计数(CBC)分析物数据,覆盖77,355名患者的523,844份样本。数据已预处理,排除90天内有输血记录、仅1份样本或CBC分析物不全的样本,用于支持实验室医学机器学习应用研究。
文件详解
- 文件名称:
KL_dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含13个字段,分别为SampleNum(匿名样本标识符)、PatientNum(匿名患者标识符)、Timestamp(样本采集时间戳,已日期偏移)、WardNum(医院科室编码)、ERY(红细胞,×10⁶/μL)、HK(血细胞比容,%)、LEUKO(白细胞,×10³/μL)、HB(血红蛋白,g/dL)、PLT(血小板,×10³/μL)、MCV(平均红细胞体积,fL)、MCHC(平均红细胞血红蛋白浓度,g/dL)、MCH(平均红细胞血红蛋白,pg)、RDW(红细胞分布宽度,%)。
数据来源
Klinikum Lippe Detmold
适用场景
- 实验室医学机器学习研究: 用于开发和验证基于机器学习的临床检测错误(如WBIT错误)检测模型。
- 全血细胞计数数据分析: 分析CBC各指标的分布特征、相关性及临床应用价值。
- 医疗数据隐私保护研究: 探索匿名化医疗数据在研究中的应用模式与隐私保护效果。
- 临床实验室质量控制: 支持实验室检测结果的一致性分析与质量改进研究。