血液疾病移植预后预测数据集HematopoieticStemCellTransplantationPrognosisPredictionDataset-niklasrehl
数据来源:互联网公开数据
标签:干细胞移植, 预后预测, 机器学习, 医疗健康, 生物统计, 临床数据, 风险评估, 数据分析
数据概述:
该数据集包含来自医疗研究的数据,记录了接受造血干细胞移植(HSCT)的患者的相关信息,旨在用于预测移植后的预后。主要特征如下:
时间跨度:数据集未明确标注时间范围,通常可视为特定研究或临床试验的横截面数据。
地理范围:数据未明确标注地理范围,但通常来源于进行HSCT的医疗机构。
数据维度:数据集包括多个与患者相关的临床和生物学指标,如:
dri_score(疾病风险指数);
psych_disturb(精神疾病);
cyto_score(细胞遗传学评分);
diabetes(糖尿病);
hla_match_c_high(HLA-C高匹配);
hla_high_res_8(HLA高分辨率8位点);
tbi_status(全身照射状态);
arrhythmia(心律失常);
hla_low_res_6(HLA低分辨率6位点);
graft_type(移植类型);
vent_hist(机械通气史);
renal_issue(肾脏问题);
pulm_severe(严重肺部疾病);
prim_disease_hct(原发病);
hla_high_res_6(HLA高分辨率6位点);
cmv_status(巨细胞病毒状态);
hla_high_res_10(HLA高分辨率10位点);
hla_match_dqb1_high(HLA-DQB1高匹配);
tce_imm_match(T细胞耗竭免疫匹配);
hla_nmdp_6(HLA-NMDP 6位点);
hla_match_c_low(HLA-C低匹配);
rituximab(利妥昔单抗使用);
hla_match_drb1_low(HLA-DRB1低匹配);
hla_match_dqb1_low(HLA-DQB1低匹配);
prod_type(产品类型);
cyto_score_detail(细胞遗传学评分详情);
conditioning_intensity(预处理强度);
ethnicity(种族);
year_hct(移植年份);
obesity(肥胖);
mrd_hct(微小残留病);
in_vivo_tcd(体内T细胞清除);
tce_match(T细胞耗竭匹配);
hla_match_a_high(HLA-A高匹配);
hepatic_severe(严重肝脏疾病);
donor_age(供者年龄);
prior_tumor(既往肿瘤);
hla_match_b_low(HLA-B低匹配);
peptic_ulcer(消化性溃疡);
age_at_hct(移植时年龄);
hla_match_a_low(HLA-A低匹配);
gvhd_proph(GVHD预防);
rheum_issue(风湿性疾病);
sex_match(性别匹配);
hla_match_b_high(HLA-B高匹配);
race_group(种族组);
comorbidity_score(合并症评分);
karnofsky_score(Karnofsky评分);
hepatic_mild(轻度肝脏疾病);
tce_div_match(T细胞耗竭不同配型匹配);
donor_related(供者相关性);
melphalan_dose(美法仑剂量);
以及其他可能影响移植预后的临床因素。
数据格式:CSV格式,文件名为train_cleaned.csv,方便数据分析和建模。
来源信息:数据来源于相关的临床研究或数据库,已进行清洗和标准化处理。
该数据集适合用于血液病学、肿瘤学以及生物医学工程领域的研究,特别是在HSCT预后预测和风险评估方面。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于血液病学、免疫学和生物统计学等领域的学术研究,如HSCT预后因素分析、生存分析、风险预测模型构建等。
行业应用:为医疗机构提供数据支持,特别是在HSCT患者的风险评估、个体化治疗方案制定和临床决策支持方面。
决策支持:支持临床医生进行风险评估,优化治疗方案,提高HSCT的成功率和患者生存率。
教育和培训:作为医学、生物统计学和数据科学等相关课程的实训素材,帮助学生和研究人员深入理解HSCT的复杂性和数据分析方法。
此数据集特别适合用于探索影响HSCT预后的关键因素,构建预测模型,并优化临床实践,最终改善患者的治疗效果。