数据集概述
本数据集包含基于Synthea软件生成的电子健康记录(EHR)语义三元组数据,通过关系型到RDF的映射实现语义实例化。数据源自ICBO 2019会议论文,包含两个压缩文件,分别对应原始EHR CSV输出和转换后的RDF图数据,用于支持医疗数据语义建模与协作研究。
文件详解
- 文件名称:synthea_csv_output_turbo_cannonical.zip
- 文件格式:ZIP
- 字段映射介绍:包含由Synthea软件合成的电子健康记录原始CSV数据,具体字段未明确,但推测涵盖患者基本信息、诊疗记录等EHR核心内容。
- 文件名称:synthea_graph_exportable.nq.zip
- 文件格式:ZIP
- 字段映射介绍:包含转换后的RDF语义三元组数据(N-Quads格式),通过关系型到RDF的映射生成,具体字段未明确,但对应EHR数据的语义化表示。
数据来源
PennTURBO团队,论文“A Collaborative, Realism-Based, Electronic Healthcare Graph: Public Data, Common Data Models, and Practical Instantiation”(ICBO 2019)
适用场景
- 医疗语义建模研究:用于分析电子健康记录的语义化转换方法与实例化效果。
- 医疗数据标准化分析:对比通用数据模型(CDM)与原生格式在EHR数据处理中的应用差异。
- 医疗知识图谱构建:基于RDF三元组数据构建电子健康知识图谱,支持医疗决策与研究。
- 医疗数据协作平台开发:为医疗数据协作平台提供语义化EHR数据实例,验证平台性能与兼容性。