Pathway2Text_Based_生物医学通路描述生成数据集_NAACL2022

数据集概述

本数据集包含2367对生物医学通路与文本描述的配对数据,支持自动通路描述生成任务,也适用于Text2Graph和BioNER任务,是NAACL 2022相关论文的配套数据集。

文件详解

  • 文件名称:pathway2text.zip
  • 文件格式:ZIP(压缩包)
  • 字段映射介绍:压缩包内包含2367对生物医学通路与对应文本描述的配对数据,具体字段需参考压缩包内文件结构(无预览信息)。

数据来源

NAACL 2022论文“Pathway2Text: Dataset and Method for Biomedical Pathway Description Generation”

适用场景

  • 生物医学文本生成研究: 用于训练和评估自动生成生物医学通路文本描述的模型。
  • 生物医学命名实体识别(BioNER): 支持生物医学领域命名实体识别任务的模型训练与验证。
  • 文本到图谱转换(Text2Graph): 用于探索文本描述与生物医学通路图谱之间的转换方法。
  • 生物医学自然语言处理(NLP)任务扩展: 为生物医学NLP领域的多任务学习提供数据支撑。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 23.56 MiB
最后更新 2026年1月18日
创建于 2026年1月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。