EHR_Based_临床信息检索测试集数据

数据集概述

本数据集是用于评估电子健康记录(EHR)临床信息检索(IR)系统的测试集,包含结构化与自由文本数据,基于梅奥诊所生物样本库队列的45,000名患者数据构建,涉及4200万份自由文本EHR文档及56个协作开发的检索主题,支持临床IR研究与系统性能分析。

文件详解

  • 文件名称:Topics_JAMIAOpen.docx
  • 文件格式:DOCX
  • 字段映射介绍:包含56个由梅奥诊所与俄勒冈健康与科学大学协作开发的临床信息检索主题,用于测试集的检索任务设计与系统评估。

适用场景

  • 临床信息检索系统评估:用于测试不同检索模型在EHR数据中的性能表现,对比传统检索与概念检索的效果差异。
  • 医疗数据检索研究:支持临床IR领域的方法学研究,探索基于EHR自由文本的患者信息发现路径。
  • 医学信息学教育:作为教学案例,帮助学习者理解临床信息检索系统的构建与评估流程。
  • 医疗数据应用优化:为医疗数据仓库中自由文本数据的检索效率提升提供实证参考。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.04 MiB
最后更新 2026年2月2日
创建于 2026年2月2日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。