心脏疾病十年预测数据集
数据来源:互联网公开数据
标签:心脏疾病,预测,心血管,风险因素,数据分析,机器学习,医学研究
数据概述:
本数据集来源于美国马萨诸塞州弗雷明汉镇正在进行的心血管疾病研究,收录了超过4,000名居民的医疗记录,旨在预测患者在未来十年内发生冠状动脉疾病(CHD)的风险。数据集包含15个属性,涵盖患者的性别、年龄、吸烟状况、血压、胆固醇水平、BMI、心率和血糖等信息,为研究心血管疾病的潜在风险因素提供了全面的数据支持。
数据用途概述:
该数据集适用于心血管疾病风险预测、医学研究和数据分析等多种场景。研究人员可以利用此数据进行风险因素分析,开发预测模型以评估个体的心脏疾病风险;医疗机构可以借助预测结果为高风险患者提供早期干预建议;同时,数据集也适合用于教育培训,帮助学习者了解心血管疾病的风险因素和预测方法。
变量说明:
- 性别(sex):男性或女性
- 年龄(age):患者的年龄
- 当前吸烟状况(currentSmoker):是否为当前吸烟者
- 每日吸烟量(cigsPerDay):患者平均每天的吸烟量
- 是否使用降压药(BPMeds):患者是否正在使用降压药物
- 是否有中风史(prevalentStroke):患者是否曾经发生中风
- 是否有高血压史(prevalentHyp):患者是否曾经患有高血压
- 是否患有糖尿病(diabetes):患者是否患有糖尿病
- 总胆固醇(totChol):患者的总胆固醇水平
- 收缩压(sysBP):患者的收缩压
- 舒张压(diaBP):患者的舒张压
- BMI:患者的体重指数
- 心率(heartRate):患者的心率
- 血糖(glucose):患者的血糖水平
预测变量:
- 10年内冠状动脉疾病风险(CHD):二元变量,1表示有风险,0表示无风险