美国心脏病患者十年发病预测数据集USHeartPatientsTen-YearCHDPrediction-pradeepvasan
数据来源:互联网公开数据
标签:心脏病, 医疗健康, 疾病预测, 风险评估, 机器学习, 临床数据, 生物统计, 流行病学
数据概述:
该数据集包含来自美国心脏病患者的临床数据,旨在用于预测患者在未来十年内患冠心病(CHD,冠心病)的风险。主要特征如下:
时间跨度:数据记录了患者的临床信息,用于预测未来十年的发病情况。
地理范围:数据来源于美国心脏病患者,具有一定的地域代表性。
数据维度:数据集包含多个关键的临床指标,包括:
性别(male):0代表女性,1代表男性。
年龄(age):患者的年龄。
教育程度(education):受教育年限。
是否吸烟(currentSmoker):0代表不吸烟,1代表吸烟。
每日吸烟量(cigsPerDay):每日吸烟的香烟数量。
是否服用降压药(BPMeds):0代表未服用,1代表服用。
是否有中风史(prevalentStroke):0代表无中风史,1代表有中风史。
是否有高血压(prevalentHyp):0代表无高血压,1代表有高血压。
是否有糖尿病(diabetes):0代表无糖尿病,1代表有糖尿病。
总胆固醇(totChol):血清总胆固醇水平。
收缩压(sysBP):收缩压。
舒张压(diaBP):舒张压。
身体质量指数(BMI):身体质量指数。
心率(heartRate):心率。
血糖(glucose):血糖水平。
十年冠心病发病情况(TenYearCHD):0代表未来十年未发病,1代表未来十年发病。
数据格式:CSV格式,文件名为US_Heart_Patients.csv,便于数据分析和处理。数据已进行标准化处理。
该数据集适用于心血管疾病风险预测、临床医学研究以及机器学习模型的构建。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于心血管疾病、流行病学、生物统计学等相关领域的学术研究,如风险因素分析、疾病预测模型构建等。
行业应用:为医疗健康行业提供数据支持,特别是在疾病风险评估、个性化医疗、健康管理等方面。
决策支持:支持医疗机构和健康管理机构制定疾病预防策略,优化患者管理方案。
教育和培训:作为医学、生物统计学、数据科学等相关专业的教学案例,帮助学生理解疾病风险评估和预测模型。
此数据集特别适合用于探索心血管疾病的风险因素,构建预测模型,并评估不同干预措施对降低发病风险的效果,最终服务于改善公众健康的目标。