PennTURBO_Synthea_Based_电子健康记录语义三元组数据

数据集概述

本数据集包含基于Synthea软件生成的电子健康记录(EHR)语义三元组数据,通过关系型到RDF的映射实现语义实例化。数据源自ICBO 2019会议论文,包含两个压缩文件,分别对应原始EHR CSV输出和转换后的RDF图数据,用于支持医疗数据语义建模与协作研究。

文件详解

  • 文件名称:synthea_csv_output_turbo_cannonical.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含由Synthea软件合成的电子健康记录原始CSV数据,具体字段未明确,但推测涵盖患者基本信息、诊疗记录等EHR核心内容。
  • 文件名称:synthea_graph_exportable.nq.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含转换后的RDF语义三元组数据(N-Quads格式),通过关系型到RDF的映射生成,具体字段未明确,但对应EHR数据的语义化表示。

数据来源

PennTURBO团队,论文“A Collaborative, Realism-Based, Electronic Healthcare Graph: Public Data, Common Data Models, and Practical Instantiation”(ICBO 2019)

适用场景

  • 医疗语义建模研究:用于分析电子健康记录的语义化转换方法与实例化效果。
  • 医疗数据标准化分析:对比通用数据模型(CDM)与原生格式在EHR数据处理中的应用差异。
  • 医疗知识图谱构建:基于RDF三元组数据构建电子健康知识图谱,支持医疗决策与研究。
  • 医疗数据协作平台开发:为医疗数据协作平台提供语义化EHR数据实例,验证平台性能与兼容性。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 104.78 MiB
最后更新 2026年1月21日
创建于 2026年1月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。