NBME临床患者笔记修正数据集

NBME临床患者笔记修正数据集 数据来源:互联网公开数据 标签:临床笔记,患者记录,修正,注释,医学,数据标注,校正 数据概述: 本数据集是基于Kaggle竞赛数据集(https://www.kaggle.com/competitions/nbme-score-clinical-patient-notes)中疑似缺失注释的手动修正记录。我们使用原始标注的训练数据进行K折交叉验证训练模型,然后将模型应用于验证数据,筛选出“假阳性错误”。这些“假阳性错误”经过人工检查,确定其是否为真正的错误或缺失的真实注释。大约50%的预测“假阳性错误”实际上是缺失的注释。 数据用途概述: 该数据集适用于临床笔记的注释改进、医学文本处理和机器学习模型的评估与优化。研究人员可以利用此数据集来提高标注精度,减少标注偏差;医疗机构可以借助修正后的数据提升患者记录的准确性和完整性;数据科学家可以使用此数据集改进自然语言处理模型在医疗文本中的应用效果。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.06 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。