健康生活方式与健康状况预测数据集HealthLifestyleandHealthStatusPredictionDataset-pmsankhe
数据来源:互联网公开数据
标签:健康, 生活方式, 机器学习, 健身, 饮食偏好, 睡眠, 职业, 数据分析, 健康预测
数据概述:
该数据集包含来自健康与生活方式调查的数据,记录了个人生活习惯与健康状况之间的关系。主要特征如下:
时间跨度:数据未标明具体时间,视作静态调查结果。
地理范围:数据未明确地域限制,可视为一般性健康生活方式调查数据。
数据维度:数据集包括多个维度,涵盖了:
phy_fitness(身体健康程度):数值型,表示身体健康水平。
diet_pref(饮食偏好):类别型,如素食、纯素食等。
act_level(活动水平):类别型,如久坐、轻度活跃等。
sleep_hrs(睡眠时长):数值型,表示每晚睡眠的小时数。
mindfulness(冥想):数值型,表示冥想的程度。
career(职业):类别型,代表不同的职业。
gender(性别):二元变量,表示性别。
daily_avg_steps(每日平均步数):数值型,表示每日平均步数。
daily_avg_calories(每日平均卡路里):数值型,表示每日平均摄入卡路里。
is_healthy(是否健康):二元变量,表示健康状况(0代表不健康,1代表健康)。
数据格式:CSV格式,文件名为innovize_final_ml.csv,便于数据分析和建模。
来源信息:数据来源于公开调查或研究,已进行匿名化处理。
该数据集适合用于健康生活方式分析、健康状况预测和相关因素影响研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于健康科学、公共卫生、行为科学等领域的学术研究,如生活方式对健康的影响分析、健康风险预测模型构建等。
行业应用:可以为健康管理平台、健身App、健康保险公司等提供数据支持,用于个性化健康建议、风险评估、用户行为分析等。
决策支持:支持政府和医疗机构制定健康促进政策,优化公共健康资源配置。
教育和培训:作为健康管理、数据分析、机器学习等课程的案例,帮助学生和研究人员理解健康数据分析。
此数据集特别适合用于探索生活方式因素与健康状况之间的关联,构建预测模型,并为改善健康提供数据支持。