数据集概述
本数据集是B2AI CM4AI项目下的APMS(亲和纯化质谱)测试数据,以RO-Crate格式组织,包含质谱数据、元数据及代码文件,共3个文件,无目录层级,可用于项目相关的数据格式验证与功能测试。
文件详解
- ro-crate-metadata.json(JSON格式)
- 字段映射:包含@id、@context、@type、name、isPartOf、@graph等核心元数据字段,用于描述数据集整体信息
- APMS_embedding_MUSIC.csv(CSV格式)
- 字段映射:包含APMS_1、RRS1及多维度数值型字段(如0.07591、0.161315等),记录APMS数据的嵌入特征
- calibrate_pairwise_distance.py(PY格式)
- 内容说明:用于校准成对距离的Python代码文件
适用场景
- 生物信息学数据格式验证:测试RO-Crate格式在APMS数据组织中的适用性
- 质谱数据预处理:利用代码文件进行成对距离校准等数据预处理操作
- 项目测试环境搭建:为B2AI CM4AI项目提供标准化的APMS测试数据支撑
- 多组学数据整合:基于CSV格式的嵌入特征数据开展多组学数据整合分析