数据集概述
本数据集为SeMRA解剖学映射数据库,支持解剖学命名资源景观分析,包含原始与处理后的映射数据、统计文件、可视化图表及配置脚本等27个文件,覆盖Uberon、MeSH等多类解剖学本体的映射关系与统计信息,可用于解剖学命名资源的整合与分析研究。
文件详解
- 文档类文件
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:包含数据集用途、作者信息、Zenodo下载链接及重建说明
- 配置与脚本类文件
- 文件名称:configuration.json、stats.json、Dockerfile、run_on_docker.sh、startup.sh
- 文件格式:JSON、Dockerfile、SH
- 字段映射介绍:configuration.json含项目名称、创建者、输入输出等配置项;stats.json含分布、术语计数等统计指标;Dockerfile与SH脚本用于环境部署与运行
- 数据类文件(压缩包)
- 文件名称:mapping_edges.tsv.gz、raw.sssom.tsv.gz、mapping_set_nodes.tsv.gz、raw.jsonl.gz、concept_nodes.tsv.gz、priority.sssom.tsv.gz等12个.gz文件
- 文件格式:GZ
- 字段映射介绍:包含原始/处理后的映射边、节点数据、SSSOM格式映射文件、JSONL格式原始数据等
- 数据类文件(非压缩)
- 文件名称:raw_counts.tsv、source_summary.tsv、priority_counts.tsv
- 文件格式:TSV
- 字段映射介绍:raw_counts.tsv为多命名资源间的映射计数矩阵;source_summary.tsv含各资源的名称、许可证、版本及术语数;priority_counts.tsv为优先级映射计数
- 可视化类文件
- 文件名称:raw_graph.svg、processed_landscape_upset.svg、processed_graph.svg、processed_landscape_histogram.svg、priority_graph.svg
- 文件格式:SVG
- 字段映射介绍:包含原始/处理后映射关系图、景观分析的Upset图与直方图、优先级映射图等可视化结果
数据来源
Zenodo(DOI: 10.5281/zenodo.11091802)
适用场景
- 解剖学命名资源整合研究:分析Uberon、MeSH等多类解剖学本体的映射关系与覆盖范围
- 生物医学本体映射质量评估:基于映射计数、优先级数据评估不同命名资源间映射的精确性与完整性
- 解剖学资源景观可视化分析:利用SVG图表展示解剖学命名资源的分布、映射关系及景观特征
- 生物医学数据标准化研究:通过SSSOM格式映射文件实现不同解剖学命名资源的标准化转换
- 生物医学数据分析环境部署:使用Dockerfile与脚本快速搭建解剖学映射数据的分析环境