SeMRA_Anatomy_Mappings_Database_解剖学命名资源景观分析数据

数据集概述

本数据集为SeMRA解剖学映射数据库,支持解剖学命名资源景观分析,包含原始与处理后的映射数据、统计文件、可视化图表及配置脚本等27个文件,覆盖Uberon、MeSH等多类解剖学本体的映射关系与统计信息,可用于解剖学命名资源的整合与分析研究。

文件详解

  • 文档类文件
  • 文件名称:README.md
  • 文件格式:MD
  • 字段映射介绍:包含数据集用途、作者信息、Zenodo下载链接及重建说明
  • 配置与脚本类文件
  • 文件名称:configuration.json、stats.json、Dockerfile、run_on_docker.sh、startup.sh
  • 文件格式:JSON、Dockerfile、SH
  • 字段映射介绍:configuration.json含项目名称、创建者、输入输出等配置项;stats.json含分布、术语计数等统计指标;Dockerfile与SH脚本用于环境部署与运行
  • 数据类文件(压缩包)
  • 文件名称:mapping_edges.tsv.gz、raw.sssom.tsv.gz、mapping_set_nodes.tsv.gz、raw.jsonl.gz、concept_nodes.tsv.gz、priority.sssom.tsv.gz等12个.gz文件
  • 文件格式:GZ
  • 字段映射介绍:包含原始/处理后的映射边、节点数据、SSSOM格式映射文件、JSONL格式原始数据等
  • 数据类文件(非压缩)
  • 文件名称:raw_counts.tsv、source_summary.tsv、priority_counts.tsv
  • 文件格式:TSV
  • 字段映射介绍:raw_counts.tsv为多命名资源间的映射计数矩阵;source_summary.tsv含各资源的名称、许可证、版本及术语数;priority_counts.tsv为优先级映射计数
  • 可视化类文件
  • 文件名称:raw_graph.svg、processed_landscape_upset.svg、processed_graph.svg、processed_landscape_histogram.svg、priority_graph.svg
  • 文件格式:SVG
  • 字段映射介绍:包含原始/处理后映射关系图、景观分析的Upset图与直方图、优先级映射图等可视化结果

数据来源

Zenodo(DOI: 10.5281/zenodo.11091802)

适用场景

  • 解剖学命名资源整合研究:分析Uberon、MeSH等多类解剖学本体的映射关系与覆盖范围
  • 生物医学本体映射质量评估:基于映射计数、优先级数据评估不同命名资源间映射的精确性与完整性
  • 解剖学资源景观可视化分析:利用SVG图表展示解剖学命名资源的分布、映射关系及景观特征
  • 生物医学数据标准化研究:通过SSSOM格式映射文件实现不同解剖学命名资源的标准化转换
  • 生物医学数据分析环境部署:使用Dockerfile与脚本快速搭建解剖学映射数据的分析环境
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 43.48 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。