-
ToxHabits_NER_毒性习惯场景命名实体识别标注数据集
2025年12月15日 30 202 192
数据集概述 该数据集是西班牙语临床文本中“毒性习惯”命名实体识别的标注数据,聚焦烟草使用、酒精消费、非法药物使用等实体的检测与分类,含训练集和测试集,为临床及流行病学研究提供标注资源。 文件详解 训练集文件: ToxHabits(ToxNER)_Train_ANNFiles.zip:ZIP格式,包含ToxNER任务的训练集标注文件...
-
MEDDOPLACE医疗文档地点相关内容抽取黄金标准标注语料库
2025年12月14日 30 48 21
数据集概述 该数据集是MEDDOPLACE任务的黄金标准标注语料库,聚焦西班牙语医疗文档中地点相关内容的抽取,包含地点检测、归一化、分类及临床科室、国籍、患者流动等关联信息的标注,适用于生物医学自然语言处理研究。 文件详解 文件名称: meddoplace_train+test+gazz+crossmap+multilingual_231003.zip...
-
MedProcNER医疗程序命名实体识别金标准标注数据集
2025年12月14日 30 210 110
数据集概述 该数据集是用于西班牙语医疗文档中临床程序信息抽取的金标准标注资源,包含训练集七百五十份文档、测试集二百五十份文档,以及SNOMED CT编码词表、SNOMED CT与MeSH交叉映射文件,还提供九种语言的银标准版本,为医疗程序检测与实体链接任务提供支持。 文件详解 文件名称:...
-
MultiCardioNER语料库_临床命名实体识别系统的心脏病学领域多语言适配数据集
2025年12月13日 30 99 6
数据集概述 该数据集为MultiCardioNER共享任务语料库,聚焦临床命名实体识别(NER)系统向心脏病学领域的适配。整合DisTEMIST(疾病)、DrugTEMIST(药物)及新标注心脏病临床病例数据,含训练、开发验证与测试集,支持西班牙语疾病识别及多语言药物识别两大任务。 文件详解 文件名称:...
-
加泰罗尼亚语语义文本相似度基准数据集1_0_2
2025年12月9日 30 86 76
数据集概述 该数据集是用于评估加泰罗尼亚语语义文本相似度(STS)的基准语料库,包含三千余对人工标注的句子对,标注遵循SemEval挑战指南,基于0到5分的相似度评分标准,为语义相似度模型的构建与评估提供支持。 文件详解 文件名称:STS-ca_v.1.0.2.zip 文件格式:ZIP压缩包...
-
SympTEMIST症状体征信息抽取标注数据集
2025年12月4日 30 65 43
数据集概述 该数据集是针对西班牙语文档中症状、体征和检查结果进行信息抽取的标注资源,包含任务训练测试集、SNOMED术语词表、九种语言的银标准数据及一万五千余例临床病例背景集,为医学文本挖掘研究提供标准化标注数据。 文件详解 文件名称: symptemist-complete_240208.zip 文件格式: ZIP压缩包 包含内容:...



