BIOMAT_MONER语料库训练与验证集

数据集概述

该数据集为BIOMAT-MONER语料库的训练(750篇文档)与验证(100篇文档)集,用于生物材料领域科学文献中制造对象相关实体的命名实体识别(NER)模型开发,聚焦生物材料实验或应用中的制造对象及属性标注。

文件详解

  • 文件名称: BIOMAT-MONER_Train_Set.zip
  • 文件格式: .zip(压缩包)
  • 内容说明: 包含BIOMAT-MONER语料库的训练集数据,具体字段及标注内容需解压后查看,未提供预览信息

数据来源

Horizon Europe BIOMATDB项目

适用场景

  • 生物材料领域NER模型开发: 训练识别科学文献中制造对象(如设备、工具、植入式医疗产品)及其属性的命名实体识别模型
  • 科学文献信息抽取研究: 探索生物材料实验相关实体的自动化提取方法
  • 生物材料知识库构建: 为生物材料数据库补充结构化的制造对象实体信息
  • 生物医学文本挖掘应用: 支持生物材料领域文献的智能分析与知识发现
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.76 MiB
最后更新 2025年12月13日
创建于 2025年12月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。