BIOMAT_AnatNER生物材料解剖结构命名实体识别训练与验证集

数据集概述

该数据集是BIOMATDB项目下的BIOMAT-AnatNER语料库训练(750篇文档)与验证(100篇文档)集,聚焦生物材料相关文献中解剖结构(组织、器官、身体部位)的命名实体识别标注,支持相关NER模型开发。

文件详解

  • 文件名称:BIOMAT-AnatNER_Train_Set.zip
  • 文件格式:ZIP压缩包(.zip)
  • 内容说明:包含语料库的训练集数据,具体字段及标注内容需解压后查看原始文件

数据来源

Horizon Europe BIOMATDB项目

适用场景

  • 生物医学NLP模型开发:训练解剖结构命名实体识别(NER)模型
  • 生物材料文献分析:提取文献中与生物材料应用相关的解剖结构提及
  • 医学信息抽取研究:探索专业领域文本中实体识别的算法优化
  • 生物医学数据库构建:辅助BIOMATDB等数据库的结构化信息补充
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.28 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。