数据集概述
本数据集是为Galaxy IUC muon工具设计的测试数据,基于已发表的10x人类PBMC 3k多组学数据,仅保留了21号染色体的过滤数据,包含20个文件,用于验证工具功能。
文件详解
- 核心数据文件(.h5mu格式,共13个):包括pp.sample_obs.h5mu、tl.snf.h5mu、pp.intersect_obs.h5mu、tl.leiden.h5mu、tl.umap.h5mu、pp.l2norm.h5mu、pbmc3k_chr21_pp.neighbors_in.h5mu等,为
muon工具处理后的多组学数据文件。
- 图像文件:
- .png格式(3个):pl.mofa_loadings.png、pl.umap.png、pl.histogram.png,为可视化结果图片
- .svg格式(1个):pl.mofa.svg,为矢量图格式的可视化结果
- 其他数据文件:
- .h5ad格式(2个):atac.h5ad、rna.h5ad,为单组学数据文件
- .pdf格式(1个):pl.embedding.pdf,为文档格式的可视化结果
适用场景
- 生物信息学工具测试:验证Galaxy IUC
muon工具的功能正确性与稳定性
- 多组学数据分析:基于人类PBMC 3k数据的21号染色体子集进行方法验证
- 可视化结果评估:对比不同格式(png/svg/pdf)的多组学数据可视化输出效果
- 数据格式兼容性测试:测试
.h5mu、.h5ad等多组学数据格式的读取与处理能力