心血管疾病风险预测数据集-aiaiaidavid

心血管疾病风险预测数据集-aiaiaidavid

数据来源:互联网公开数据

标签:心血管疾病,健康,医疗,风险预测,血压,胆固醇,生活方式,年龄,身高,体重

数据概述: 本数据集是Kaggle上公开的心血管疾病数据集(cardio_train.csv)的清理和优化版本,原始数据来自:https://www.kaggle.com/sulianova/cardiovascular-disease-dataset。数据经过处理,修正了负值,并移除了异常值。数据集包含一系列用于预测心血管疾病发生与否的特征变量。

数据包含以下特征:

  • 年龄(AGE):整数,单位为年
  • 身高(HEIGHT):整数,单位为厘米
  • 体重(WEIGHT):整数,单位为公斤
  • 性别(GENDER):类别型(1:女性,2:男性)
  • 收缩压(AP_HIGH):整数
  • 舒张压(AP_LOW):整数
  • 胆固醇(CHOLESTEROL):类别型(1:正常,2:高于正常,3:远高于正常)
  • 葡萄糖(GLUCOSE):类别型(1:正常,2:高于正常,3:远高于正常)
  • 吸烟(SMOKE):类别型(0:否,1:是)
  • 饮酒(ALCOHOL):类别型(0:否,1:是)
  • 体力活动(PHYSICAL_ACTIVITY):类别型(0:否,1:是)

目标变量:

  • 心血管疾病(CARDIO_DISEASE):类别型(0:无,1:有)

数据用途概述: 该数据集适用于心血管疾病风险预测模型构建、健康风险因素分析、数据挖掘、机器学习等多种研究方向。研究人员可以使用此数据训练预测模型,探索不同健康指标与心血管疾病之间的关系;临床医生可以利用模型辅助疾病风险评估;学生和数据科学爱好者可以将其用于实践数据分析和机器学习技能。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.4 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。