数据集概述
本数据集是Galaxy IUC SnapATAC2工具的测试数据,基于已发表的10x人类PBMC 500单细胞ATAC-seq数据,仅保留21号染色体过滤后的结果,包含27个相关文件,支持工具功能验证与流程测试。
文件详解
- 核心数据文件(.h5ad格式,共16个)
- 示例文件:pp.knn.pbmc_500_chr21.h5ad、tl.marker_regions.pbmc_500_chr21.h5ad等
- 内容:存储单细胞ATAC-seq数据处理各阶段的结果,涵盖细胞过滤、特征矩阵构建、聚类、标记区域识别等流程数据
- 压缩文件(.gz格式,共5个)
- 示例文件:snap_datasets_pbmc10k_multiome_ATAC.h5ad.gz、pp.import_fragments.h5ad.gz等
- 内容:压缩的单细胞多组学数据文件及片段文件,包含PBMC 10k样本的ATAC和RNA数据
- 文档与可视化文件
- 示例文件:pl.frag_size_distr.pdf、pl.spectral_eigenvalues.pdf、pl.umap.svg
- 内容:PDF格式的片段大小分布、特征值分析图表,SVG格式的UMAP降维可视化结果
- 其他文件
- 示例文件:merged_peaks.tabular(合并峰表)、cre_hea.bed(调控元件位置文件)、pbmc_500_chr21_subsample.bam(测序比对文件)
- 内容:存储实验结果的表格、基因组区域注释及测序原始数据
适用场景
- 生物信息学工具测试:验证Galaxy IUC平台上SnapATAC2工具的功能完整性与流程稳定性
- 单细胞ATAC-seq数据分析流程验证:复现细胞过滤、特征构建、聚类等标准分析步骤
- 多组学数据整合研究:探索ATAC-seq与RNA-seq数据的联合分析方法
- 基因组调控元件研究:基于标记区域与合并峰数据,分析细胞类型特异性调控元件
- 生物信息学教学:作为单细胞表观基因组学数据分析的教学案例数据