-
MedProcNER医疗程序命名实体识别金标准标注数据集
2025年12月14日 30 3 0
数据集概述 该数据集是用于西班牙语医疗文档中临床程序信息抽取的金标准标注资源,包含训练集七百五十份文档、测试集二百五十份文档,以及SNOMED CT编码词表、SNOMED CT与MeSH交叉映射文件,还提供九种语言的银标准版本,为医疗程序检测与实体链接任务提供支持。 文件详解 文件名称:...
-
生物医学文本本体富集数据集
2025年12月12日 30 180 47
数据集概述 本数据集是支持从生物医学文本中进行本体富集的资源,通过概念发现与定位实现。基于MedMentions数据集(PubMed摘要),适配2014和2017版SNOMED CT的疾病(障碍)子类别及临床发现、操作、药物/生物制品等更广泛类别,为生物医学本体研究提供数据支持。 文件详解 文件名称: OET-data-ver4.zip 文件格式:...
-
MEDDOPROF西班牙语医疗文档职业检测标注数据集
2025年12月10日 30 60 4
数据集概述 该数据集为MEDDOPROF金标准语料库,包含一千八百四十四篇西班牙语临床案例,标注内容涉及职业、工作状态及活动等信息,采用brat标注工具格式存储,还包含职业提及与ESCO、SNOMED CT术语映射的TSV文件,支持职业健康领域的自然语言处理研究。 文件详解 该数据集包含多个目录和文件,具体说明如下: - 目录文件: -...



