健康状况与糖尿病风险预测数据集HealthStatusandDiabetesRiskPredictionDataset-athangyende
数据来源:互联网公开数据
标签:糖尿病预测, 健康指标, 慢性病, 公共卫生, 流行病学, 机器学习, 数据分析, 健康风险评估
数据概述:
该数据集包含来自美国疾病控制与预防中心(CDC)的BRFSS(Behavioral Risk Factor Surveillance System,行为风险因素监测系统)2021年调查数据,记录了与糖尿病相关的健康指标。主要特征如下:
时间跨度:数据来源于2021年的调查。
地理范围:数据主要反映美国居民的健康状况。
数据维度:数据集包含多个关键健康指标,如糖尿病状态(Diabetes_012)、高血压(HighBP)、高胆固醇(HighChol)、胆固醇检查(CholCheck)、身体质量指数(BMI)、吸烟状况(Smoker)、中风史(Stroke)、心脏病或心脏病发作史(HeartDiseaseorAttack)、身体活动(PhysActivity)、水果摄入(Fruits)、蔬菜摄入(Veggies)、酗酒(HvyAlcoholConsump)、是否有医疗保健(AnyHealthcare)、因费用问题无医生就诊(NoDocbcCost)、总体健康状况(GenHlth)、心理健康状况(MentHlth)、身体健康状况(PhysHlth)、行走困难(DiffWalk)、性别(Sex)、年龄(Age)、教育程度(Education)和收入(Income)。
数据格式:CSV格式,文件名为diabetes_012_health_indicators_BRFSS2021.csv,便于数据分析和建模。
来源信息:数据来源于CDC的BRFSS调查,已进行初步的数据清洗和整理。
该数据集适合用于糖尿病风险预测、健康状况评估和公共卫生研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于公共卫生、流行病学和慢性病管理领域的研究,如糖尿病风险因素分析、健康状况预测、健康行为与疾病关联性研究等。
行业应用:可以为医疗健康行业提供数据支持,尤其是在健康风险评估、个性化健康管理、健康教育等领域。
决策支持:支持公共卫生部门的决策制定,用于制定疾病预防策略、优化医疗资源配置。
教育和培训:作为医学、公共卫生、数据科学等相关专业课程的辅助材料,帮助学生和研究人员深入理解健康数据分析。
此数据集特别适合用于探索健康行为与糖尿病风险之间的关系,预测个体患糖尿病的风险,并支持制定有效的健康干预措施。