胰腺癌生物医学知识图谱数据集

数据集概述

该数据集包含约一百万条高置信度胰腺癌生物医学三元组,涵盖23个相关生物医学实体和11种常见关系类型。每条三元组配有模拟科学表述的自然语言句子及0.75至1.00的注意力得分,为生物医学自然语言处理模型提供训练或验证资源。

文件详解

  • 文件名称: pancreatic_cancer_kg_original.csv
  • 文件格式: CSV
  • 字段映射:
  • head: 头实体(如erlotinib)
  • relation: 实体间关系(如associated_with)
  • tail: 尾实体(如p53)
  • sentence: 模拟科学表述的自然语言句子
  • attention_score: 模型置信度得分(0.75-1.00)

适用场景

  • 生物医学自然语言处理模型训练与验证
  • 知识提取系统的基准测试
  • 胰腺癌相关生物医学实体关系挖掘
  • 生物医学文本生成模型优化
  • 医学知识图谱构建方法研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 17.81 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。