Fitbit用户活动与健康数据分析数据集-2016年12月
数据来源:互联网公开数据
标签:Fitbit,健身追踪,用户行为,健康数据,活动分析,睡眠监测,心率,卡路里,步数,SQL清洗
数据概述:
本数据集基于2016年12月3日至5日期间,通过亚马逊Mechanical Turk平台收集的Fitbit用户数据。共有30位符合条件的用户同意分享其个人追踪数据,包括分钟级别的身体活动、心率和睡眠监测数据。数据可通过导出会话ID(A列)或时间戳(B列)进行解析。不同输出结果反映了不同类型Fitbit追踪器的使用以及用户个人的追踪行为和偏好。
数据经过了清洗和整理,主要修改包括:
-
为了简化分析,移除了冗余的表格,如dailyCalories_merged.csv、dailyIntensities_merged.csv、dailySteps_merged.csv,其内容已包含在dailyActivity_merged.csv中。同时,宽格式的minutesCaloriesWide_merged.csv、minutesIntensitiesWide_merged.csv、minuteStepsWide_merged.csv也被移除,仅保留长格式数据。
-
基于Id和ActivityHour创建了hourly_activity.csv和minute_activity.csv两个新表格,用于基于小时记录进行变量间的比较和相关性测量,使用了LEFT JOIN函数。
-
使用PARSE_DATE()和PARSE_DATETIME()命令对DATE和DATETIME类型的数据进行验证,确保数据类型正确。由于原始CSV文件中日期时间格式包含"AM"和"PM"文本,导入时将DATETIME和DATE类型的列作为STRING类型导入。
数据用途概述:
该数据集适用于多种健康与健身相关的研究和分析。研究人员可以利用该数据分析用户的活动水平、睡眠质量、心率变化等,探索用户行为与健康状况之间的关系。例如,可以分析不同活动强度下的卡路里消耗,研究睡眠模式对健康的影响,或者评估不同用户的运动习惯。此外,该数据集也适用于数据科学和机器学习的教学,用于演示数据清洗、数据分析和可视化等技能。