数据集概述
该数据集包含俄罗斯圣彼得堡国立医科大学(SSMU)医院门诊就诊的匿名化数据,涵盖七千六百二十五条就诊记录,每条记录包含患者标识、就诊标识、就诊时间、症状、病史、ICD-10疾病编码等字段,数据以TSV格式存储并压缩为ZIP文件。
文件详解
该数据集包含一个压缩文件,具体说明如下:
- 文件名称: RuMedPrimeData.zip
- 文件格式: ZIP压缩包 (.zip)
- 压缩包内文件: data.tsv(Tab-Separated Values格式,MD5校验值abc73e2b0e1fecb187e10152185b4c64)
- 字段映射:
- new_patient_id: 患者唯一标识
- new_event_id: 就诊唯一标识
- new_event_time: 就诊日期和时间(按患者随机化处理)
- symptoms: 医生记录的患者主诉症状
- anamnesis: 患者病史信息
- ICD10: 依据ICD-10分类标准的疾病编码
数据来源
SSMU医院
适用场景
- 临床医学研究: 分析门诊患者症状与ICD-10疾病编码的对应关系
- 自然语言处理: 用于医疗文本(症状、病史)的信息抽取与分类模型训练
- 医疗数据匿名化研究: 验证多步骤匿名化方法的有效性与合规性
- 医疗资源管理: 基于就诊记录分析门诊疾病分布特征与诊疗趋势