-
生物医学文本本体富集数据集
2025年12月12日 30 76 25
数据集概述 本数据集是支持从生物医学文本中进行本体富集的资源,通过概念发现与定位实现。基于MedMentions数据集(PubMed摘要),适配2014和2017版SNOMED CT的疾病(障碍)子类别及临床发现、操作、药物/生物制品等更广泛类别,为生物医学本体研究提供数据支持。 文件详解 文件名称: OET-data-ver4.zip 文件格式:...
-
TBGA基因疾病关联生物医学关系抽取数据集
2025年12月7日 30 202 76
数据集概述 该数据集为TBGA,是用于基因-疾病关联(GDA)抽取的大规模半自动标注数据集,包含训练、验证、测试集文本文件及关系名称与ID映射的JSON文件,每条记录对应从句子中提取的单个GDA,以JSON对象结构存储相关信息。 文件详解 数据集压缩包: TBGA.zip,ZIP格式,包含TBGA文件夹及内部所有文件 训练集文本文件:...
-
机器学习模型训练与评估数据集MachineLearningModelTrainingandEvaluationDatasets-julianhardt
2025年5月26日 30 158 71
机器学习模型训练与评估数据集MachineLearningModelTrainingandEvaluationDatasets-julianhardt 数据来源:互联网公开数据 标签:机器学习, 模型评估, 神经网络, 数据挖掘, 分类任务, 葡萄酒质量, 生物医学文本, 国会投票记录, 网格搜索 数据概述:...
-
基因组生物医学事件数据集
2025年4月15日 30 125 104
基因组生物医学事件数据集 数据来源:互联网公开数据 标签:生物医学文本,事件标注,自然语言处理,NLP,药物效果分析,医学条件识别,数据集简化版 数据概述: 本数据集是GENIA事件标注数据集的简化版本,来源于TEES平台,基于BioNLP共享任务2011(BioNLP Shared Task...



