医疗信息提取数据集

医疗信息提取数据集 数据来源:互联网公开数据 标签:医疗信息,关系提取,PubMed,治疗关系,因果关系,自然语言处理,众包标注,医学研究 数据概述: 本数据集包含从PubMed摘要中提取的3,984条医疗句子,并标注了离散医疗术语之间的关系。数据集主要关注“治疗”和“原因”两类关系,其中包含1,043条治疗关系句子和1,787条因果关系句子。众包标注人员被要求对给定的术语对(例如“路易体痴呆”和“构形良好的幻视”)之间的关系进行标记(例如“路易体痴呆导致构形良好的幻视”)。 数据用途概述: 该数据集适用于医学关系提取、自然语言处理研究、众包标注质量评估等多个场景。研究人员可以利用此数据集进行语言模糊性的测量和处理;医学专家可以参考标注结果来提高信息提取的准确性;众包平台可以借鉴数据集提升标注任务的质量。此外,该数据集也可以用于教育培训,帮助学习者理解医学信息提取和自然语言处理的基本方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.03 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。