英国生物银行队列合成数据集

数据集概述

本数据集存储基于英国生物银行(UKB)队列数据库生成的合成数据,用于复现长期空气污染暴露健康风险相关分析,支持代码测试与队列分析示例演示,数据为模拟生成,不可用于真实研究推断。

文件详解

  • 核心合成数据文件(含CSV与RDS两种格式):
  • synthbdcohortinfo.csv/synthbdcohortinfo.RDS:502,360名参与者的随访期、出生/死亡日期基础队列信息
  • synthbdbasevar.csv/synthbdbasevar.RDS:招募时收集的基线变量数据
  • synthpmdata.csv/synthpmdata.RDS:基于居住史重建的参与者PM2.5年平均暴露数据
  • synthoutdeath.csv/synthoutdeath.RDS:随访期间死亡记录,含死亡日期与ICD-10编码
  • 辅助文件:
  • codebook.pdf:变量代码本,含原始UKB数据库字段参考
  • asscentre.csv:UKB参与者招募评估中心信息,含代码、名称及英国国家网格坐标
  • Countries_December_2022_GB_BUC.zip:英国(英格兰、威尔士、苏格兰)边界 shapefile压缩包,用于地图绘制

数据来源

英国生物银行(UKB)队列数据库

适用场景

  • 空气污染健康风险分析:复现基于UKB队列的长期PM2.5暴露相关健康风险分析流程
  • 代码测试与验证:用于测试UKB队列数据分析代码的可行性与准确性
  • 队列研究教学:作为队列研究方法、生存分析等教学场景的演示数据
  • 数据可视化示例:结合地理边界文件,演示空气污染暴露与健康结局的空间分布分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 319.54 MiB
最后更新 2025年12月17日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。