西班牙临床病例语料库SPACCC

数据集概述

该数据集为西班牙语临床病例语料库(SPACCC),是从西班牙开放获取医学出版物(SciELO)中人工分类的临床病例报告集合,包含1000个病例共396,988词,覆盖肿瘤学、泌尿学等多医学专科,兼具生物医学文献与临床记录特征。

文件详解

  • 文件名称:SPACCC.zip
  • 文件格式:ZIP压缩包(.zip)
  • 内容说明:压缩包内包含人工分类的西班牙语临床病例报告数据,具体字段及结构需解压后查看原始文件获取

数据来源

Secretaría de Estado para el Avance Digital

适用场景

  • 医学自然语言处理研究:用于西班牙语临床文本的命名实体识别、文本分类等算法训练与验证
  • 临床医学数据挖掘:分析多专科临床病例的文本特征与诊疗模式
  • 生物医学文献研究:探索临床病例报告的语言规律与信息抽取方法
  • 医疗AI模型开发:支撑西班牙语医疗领域智能系统(如辅助诊断、病历分析)的研发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.28 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。