PyOBO_Indexed_属性整合数据_202X

数据集概述

本数据集是PyOBO索引的所有属性的整合,包含原始CC0许可内容及各来源许可的衍生内容。数据集共5个文件,涵盖属性元数据、样本数据、压缩数据及详细摘要等,支持生物医学本体属性的查询与分析。

文件详解

  • properties_metadata.json
  • 文件格式:JSON
  • 字段映射介绍:包含version(版本)、git_hash(Git哈希)、date(日期)、count(计数)四个核心字段
  • properties_sample.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含prefix(前缀)、identifier(标识符)、property(属性)、value(值)四个字段,示例数据含aero、aism等本体的属性映射
  • properties.tsv.gz
  • 文件格式:TSV.GZ
  • 字段映射介绍:压缩格式的完整属性数据文件,包含所有PyOBO索引的属性记录
  • properties_summary_detailed.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含本体前缀(如ncbitaxon、ncit、chebi)、属性及对应计数,示例数据含has_rank、NCIT:P106等属性的统计
  • properties_summary.tsv
  • 文件格式:TSV
  • 字段映射介绍:属性数据的摘要统计文件,具体字段未提供预览

适用场景

  • 生物医学本体属性分析: 用于查询和分析各本体(如aero、aism、ncbitaxon)的属性定义与映射关系
  • 本体数据整合研究: 支持不同生物医学本体间的属性关联与跨本体数据集成
  • 数据标准化应用: 为生物医学数据标注和标准化提供统一的属性索引参考
  • 开放数据资源建设: 基于CC0许可内容构建开源的生物医学属性数据库
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 55.93 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。