数据集概述
数据集包含22名健康年轻男性在24小时内连续监测的生理、心理和行为数据,数据采集时间跨度为两天,旨在研究个体对心理生理应激的反应及睡眠质量。数据由BioBeats公司与意大利比萨大学研究人员合作收集,BioBeats是一家专注于健康科学领域的物联网可穿戴设备公司。数据集涵盖心率、加速度计数据、睡眠质量、心理问卷评分、日常活动记录及唾液样本中的生物标记物信息,共生成约12万条记录,数据来源包括Polar H7心率监测器、ActiGraph wGT3X-BT活动记录仪及相关问卷和唾液样本分析。所有数据均经过匿名化处理,符合欧盟通用数据保护条例(GDPR)和赫尔辛基宣言(2013修订版),并获得比萨大学伦理委员会批准(#0077455/2018)。
数据内容
MMASH数据集由七个主要文件组成,涵盖22名参与者的详细记录,总计约119,390条记录。每个参与者提供两天的连续数据,包括心率、活动、睡眠、心理状态和唾液生物标记物。心率数据(RR.csv)包含约10万条心跳间期记录,活动数据(Actigraph.csv)记录每秒的加速度和步数信息,睡眠数据(sleep.csv)包含44条睡眠记录(每人两天)。心理问卷(questionnaire.csv)提供MEQ、STAI-Y、PSQI、BIS/BAS和DSI等评分,活动记录(Activity.csv)涵盖12种日常活动类别,唾液数据(saliva.csv)包含43条记录(User_21因样本问题缺失)。数据覆盖125个国家的参与者来源国,反映国际化特征。
字段定义
数据集包含以下核心字段类别:
- 用户信息(user_info.csv):
- 性别:M(男性)或F(女性)
- 身高:以厘米(cm)为单位
- 体重:以千克(kg)为单位
- 年龄:以年为单位
- 睡眠信息(sleep.csv):
- 入睡日期:1或2,表示第一天或第二天
- 入睡时间:入睡的当天时间(小时:分钟)
- 起床日期:1或2,表示第一天或第二天
- 起床时间:起床的当天时间(小时:分钟)
- 入睡潜伏期:入睡所需时间(分钟)
- 睡眠效率:睡眠时间占总卧床时间的百分比
- 总卧床时间:每晚卧床的分钟数
- 总睡眠时间(TST):每晚睡眠的分钟数
- 入睡后觉醒时间(WASO):首次入睡后觉醒的总时间
- 夜间觉醒次数:夜间觉醒的次数
- 平均觉醒时长:夜间每次觉醒的平均秒数
- 移动指数:无移动时间占移动阶段的百分比
- 碎片化指数:移动时间占静止阶段的百分比
- 睡眠碎片化指数:移动指数与碎片化指数的比率
- 心跳间期(RR.csv):
- 心跳间期(ibi_s):连续两次心跳之间的时间(秒)
- 日期:1或2,表示第一天或第二天
- 时间:心跳发生的时间(小时:分钟:秒)
- 心理问卷(questionnaire.csv):
- MEQ:晨昏类型问卷评分(16-86,≤41为晚型,≥59为早型,42-58为中间型)
- STAI1:状态焦虑评分(20-80,50为高焦虑)
- STAI2:特质焦虑评分(20-80,50为高焦虑)
- PSQI:匹兹堡睡眠质量指数(0-21,<6为良好睡眠质量)
- BIS/BAS:行为抑制/激活指数,包含BIS(回避行为)、Drive(动机强度)、Reward(奖励反应)、Fun(寻求刺激)四个子维度
- Daily_stress:每日压力清单评分(0-406,值越高表示压力事件频率和强度越高)
- PANAS:正负情绪量表评分(5-50,包含10、14、18、22及次日9点五个时间点的正负情绪评分)
- 日常活动(Activity.csv):
- 活动类别:12种活动(1:睡眠,2:躺卧,3:坐姿,4:轻度运动,5:中度运动,6:重度运动,7:进食,8:小屏幕使用,9:大屏幕使用,10:含咖啡因饮料,11:吸烟,12:饮酒)
- 开始时间:活动开始的时间(小时:分钟)
- 结束时间:活动结束的时间(小时:分钟)
- 日期:1或2,表示第一天或第二天
- 加速度计数据(Actigraph.csv):
- Axis1:X轴加速度(牛顿-米)
- Axis2:Y轴加速度(牛顿-米)
- Axis3:Z轴加速度(牛顿-米)
- 步数:每秒步数
- 心率:每分钟心跳次数(bpm)
- 倾角计关闭:值为1表示倾角计未激活(每秒记录)
- 倾角计站立:值为1表示站立姿势(每秒记录)
- 倾角计坐姿:值为1表示坐姿(每秒记录)
- 倾角计躺卧:值为1表示躺卧姿势(每秒记录)
- 向量幅度:基于加速度数据的运动向量(牛顿-米)
- 日期:1或2,表示第一天或第二天
- 时间:记录时间(小时:分钟:秒)
- 唾液样本(saliva.csv):
- 样本时间:睡前或醒后
- 褪黑素水平:每微克蛋白质的褪黑素含量(μg)
- 皮质醇水平:每100微克蛋白质的皮质醇含量(μg)
数据特征
数据集时间跨度为两天,连续记录了22名参与者的心率、加速度计、睡眠和心理状态数据,时间分辨率高(心率和加速度计数据精确到秒)。活动类别涵盖12种日常行为,全面反映参与者的生活模式。心理问卷评分提供多维度心理状态评估,包括焦虑、睡眠质量、情绪和压力水平。唾液样本数据提供生物标记物信息(如褪黑素和皮质醇),支持生理与心理关联分析。数据完整性高,除User_21的唾液数据因样本问题缺失外,其余字段缺失率极低。参与者来源国覆盖125个国家,体现国际化特征。所有数据均通过专业设备(Polar H7和ActiGraph wGT3X-BT)采集,确保测量精度。
适用场景
本数据集适用于以下分析与应用场景:
- 心理生理关联研究:探索心理状态(如焦虑、压力)与生理指标(如心率、睡眠质量)的关系
- 睡眠质量分析:比较主观(PSQI)与客观(睡眠效率、碎片化指数)睡眠质量
- 日常活动模式研究:分析个体活动类型、频率及其与心理生理状态的关联
- 压力响应建模:基于心率变异性、唾液生物标记物和压力评分构建应激预测模型
- 机器学习算法开发:利用加速度计和心率数据开发活动识别、情绪预测或压力检测模型
- 生物标记物研究:分析褪黑素和皮质醇水平与睡眠及压力的关系
- 跨学科研究:支持心理学、运动科学和健康科学领域的综合分析
- 健康监测技术开发:为可穿戴设备提供基准数据,优化日常健康评估算法
数据来源
BioBeats公司与意大利比萨大学合作,通过Polar H7心率监测器、ActiGraph wGT3X-BT活动记录仪及唾液样本分析收集数据。