造血干细胞移植预后预测数据集HematopoieticStemCellTransplantationPrognosisPrediction-hackerkhan
数据来源:互联网公开数据
标签:医疗健康, 干细胞移植, 预后预测, 机器学习, 生物医学, 数据分析, 临床研究, 风险评估
数据概述:
该数据集包含与造血干细胞移植(HSCT)相关的临床数据,旨在用于预测移植后的预后结果。主要特征如下:
时间跨度:数据未明确标注时间范围,通常被视为一个静态的、用于建模分析的临床数据集。
地理范围:数据来源未明确,但数据集包含了多项与患者健康状况相关的临床指标,可用于广泛的HSCT研究。
数据维度:数据集包含多个维度,主要字段包括但不限于:ID(患者标识符)、dri_score(供者相关风险指数)、psych_disturb(精神疾病史)、cyto_score(细胞遗传学风险评分)、diabetes(糖尿病史)、hla_match_c_high(HLA-C位点高分辨配型匹配度)、hla_high_res_8(HLA高分辨8位点)、tbi_status(全身照射状态)、arrhythmia(心律失常史)、hla_low_res_6(HLA低分辨6位点)、graft_type(移植类型)、vent_hist(机械通气史)、renal_issue(肾脏问题)、pulm_severe(严重肺部疾病)、prim_disease_hct(移植适应症)、hla_high_res_6(HLA高分辨6位点)、cmv_status(巨细胞病毒状态)、hla_high_res_10(HLA高分辨10位点)、hla_match_dqb1_high(HLA-DQB1位点高分辨配型匹配度)、tce_imm_match(T细胞免疫匹配)、hla_nmdp_6(HLA-NMDP 6位点)、hla_match_c_low(HLA-C位点低分辨配型匹配度)、rituximab(利妥昔单抗使用情况)、hla_match_drb1_low(HLA-DRB1位点低分辨配型匹配度)、hla_match_dqb1_low(HLA-DQB1位点低分辨配型匹配度)、prod_type(产品类型)、cyto_score_detail(细胞遗传学风险评分详细信息)、conditioning_intensity(预处理强度)、ethnicity(种族)、year_hct(移植年份)、obesity(肥胖史)、mrd_hct(微小残留病)、in_vivo_tcd(体内T细胞清除)、tce_match(T细胞匹配)、hla_match_a_high(HLA-A位点高分辨配型匹配度)、hepatic_severe(严重肝脏疾病)、donor_age(供者年龄)、prior_tumor(肿瘤病史)、hla_match_b_low(HLA-B位点低分辨配型匹配度)、peptic_ulcer(消化性溃疡)、age_at_hct(移植时年龄)、hla_match_a_low(HLA-A位点低分辨配型匹配度)、gvhd_proph(移植物抗宿主病预防)、rheum_issue(风湿性疾病)、sex_match(性别匹配)、hla_match_b_high(HLA-B位点高分辨配型匹配度)。
数据格式:数据集包含CSV文件(testcsv, traincsv),以及用于模型训练的pkl文件(ann_model.pkl, label_encoders.pkl, scalers.pkl),便于数据分析、模型训练和结果评估。
来源信息:数据来源于公开数据集,可能来自临床研究或医疗数据库。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于血液病学、肿瘤学和生物统计学等领域的研究,如HSCT预后因素分析、风险预测模型构建、个体化治疗方案探索等。
行业应用:可用于医院和医疗机构的临床决策支持系统,辅助医生评估患者风险、优化治疗方案,提高HSCT成功率。
决策支持:支持医疗管理部门进行资源分配、制定相关政策,改善HSCT患者的生存质量。
教育和培训:可作为医学、生物信息学等专业的教学案例,帮助学生和研究人员深入理解HSCT相关知识,掌握数据分析和机器学习在医疗领域的应用。
此数据集特别适合用于探索HSCT患者的临床特征与预后之间的关系,构建预测模型,从而提高临床决策的准确性和效率。