临床笔记知识增强混合抽取式摘要管道数据集

数据集概述

该数据集包含四千九百九十九条医疗转录文本,围绕临床笔记知识增强混合抽取式摘要管道构建,涉及过敏/免疫学等医疗专科的转录内容,为临床文本摘要研究提供数据支持。

文件详解

  • 文件名称:A Knowledge-Enhanced Hybrid Extractive Summarizati/mtsamples.csv
  • 文件格式:CSV(.csv)
  • 字段映射:包含description(描述)、medical_specialty(医疗专科)、sample_name(样本名称)、transcription(转录文本)、keywords(关键词)等字段,示例字段值如医疗专科为“Allergy / Immunology”、样本名称为“Allergic Rhinitis”。

适用场景

  • 临床文本摘要算法研究:验证TF-IDF、UMLS实体、BioLinkBERT等技术在临床笔记摘要中的应用效果
  • 医疗NLP模型训练:用于训练医疗领域文本抽取与理解模型
  • 医疗数据标准化分析:探索临床转录文本的结构化处理方法
  • 医学专科文本特征研究:分析不同医疗专科转录文本的语言特点与关键词分布
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.77 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。