数据集概述
本数据集是基于电子健康记录预测多药物生理效应研究的补充数据,包含4个文件,涵盖XGBoost分类器优化超参数、416种活性药物成分信息、SHAP分析得出的Top20重要特征列表及不同特征组合和特定人群数据集下的AUROC值,为药物生理效应预测模型研究提供支撑。
文件详解
- Supplementary Data 1_20241101.xlsx
- 文件格式:XLSX
- 字段映射介绍:20个选定测量项目的XGBoost分类器优化超参数信息
- Supplementary Data 2_20241101.xlsx
- 文件格式:XLSX
- 字段映射介绍:用于开发20个选定测量项目机器学习模型的416种活性药物成分(APIs)信息
- Supplementary Data 3_20241101.xlsx
- 文件格式:XLSX
- 字段映射介绍:通过SHAP分析得出的每个XGBoost分类器的Top20最高特征重要性列表
- Supplementary Data 4_20241101.xlsx
- 文件格式:XLSX
- 字段映射介绍:使用特征类型成对组合作为输入、特定种族和性别MIMIC-IV数据集时,20个测量项目XGBoost分类器的AUROC值
适用场景
- 药物生理效应预测研究: 用于多药物联合使用时生理效应预测模型的开发与验证
- 机器学习模型优化: 分析XGBoost分类器超参数对预测性能的影响,指导模型参数调优
- 药物特征重要性分析: 基于SHAP分析结果,探究影响药物生理效应预测的关键特征
- 医疗数据亚组分析: 研究不同种族、性别人群及特征组合对药物生理效应预测模型性能的影响