-
NLM_Chem_Based_生物医学文献化学实体识别标注语料库与指南
2026年1月23日 30 75 34
数据集概述 本数据集为NLM-Chem语料库,包含150篇PubMed全文文献,由十位NLM专家索引员双重标注,含约五千个独特化学名称标注及对应约两千个MeSH标识符,用于支持化学实体识别工具的开发与评估,解决现有工具在全文中性能较低的问题,挖掘文献中更详细的化学信息。 文件详解 NLM-Chem-corpus.zip 文件格式:ZIP...
-
Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test
2026年1月11日 30 208 29
数据集概述 本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。 文件详解 文件名称:curated_test_set.json 文件格式:JSON 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:...



