人体健康与肥胖预测数据集HumanHealthandObesityPredictionDataset-mohamedmustafashaban
数据来源:互联网公开数据
标签:肥胖预测, 健康评估, 机器学习, 身体指标, 生活方式, 数据分析, 分类模型, 营养饮食
数据概述:
该数据集包含来自公开健康调查的数据,记录了影响人体健康状况和肥胖程度的多种因素。主要特征如下:
时间跨度:数据未标明具体时间,视作静态横截面数据使用。
地理范围:数据未明确指出地理范围,但根据数据内容推测,可能涵盖了不同国家或地区的人群。
数据维度:数据集包括多个关键特征,如:id(个体唯一标识)、Gender(性别)、Age(年龄)、Height(身高)、Weight(体重)、family_history_with_overweight(是否有肥胖家族史)、FAVC(是否经常食用高热量食物)、FCVC(每日蔬菜摄入量)、NCP(每日正餐数量)、CAEC(两餐之间是否食用食物)、SMOKE(是否吸烟)、CH2O(每日饮水)、SCC(是否监控卡路里摄入)、FAF(每周身体活动量)、TUE(每周锻炼时间)、CALC(酒精摄入量)、MTRANS(主要交通方式)。train.csv 文件中还包含目标变量 NObeyesdad(肥胖程度分类)。
数据格式:CSV格式,包含 train.csv 和 test.csv 两个文件,便于进行数据分析和模型训练。
数据来源:数据来源于公开数据集,已进行匿名化处理。
该数据集适合用于研究肥胖相关因素、健康状况预测和生活方式对健康的影响,以及相关的机器学习建模。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于健康科学、公共卫生领域的研究,如肥胖影响因素分析、生活方式对健康的影响研究等。
行业应用:可以为健康管理、健身行业提供数据支持,尤其在个性化健康建议、风险评估等方面具备实用性。
决策支持:支持政府部门制定公共卫生政策,以及医疗机构进行疾病预防和健康管理。
教育和培训:作为健康数据分析、机器学习课程的教学案例,帮助学生理解健康相关数据的分析方法。
此数据集特别适合用于探索影响肥胖的多种因素之间的关系,构建预测模型,并为改善健康状况提供数据支持。