Galaxy_IUC_SnapATAC2_Based_工具测试数据完整数据集

数据集概述

本数据集是Galaxy IUC SnapATAC2工具的测试数据,基于已发表的10x人类PBMC 500单细胞ATAC-seq数据,仅保留21号染色体过滤后的结果,包含27个相关文件,支持工具功能验证与流程测试。

文件详解

  • 核心数据文件(.h5ad格式,共16个)
  • 示例文件:pp.knn.pbmc_500_chr21.h5ad、tl.marker_regions.pbmc_500_chr21.h5ad等
  • 内容:存储单细胞ATAC-seq数据处理各阶段的结果,涵盖细胞过滤、特征矩阵构建、聚类、标记区域识别等流程数据
  • 压缩文件(.gz格式,共5个)
  • 示例文件:snap_datasets_pbmc10k_multiome_ATAC.h5ad.gz、pp.import_fragments.h5ad.gz等
  • 内容:压缩的单细胞多组学数据文件及片段文件,包含PBMC 10k样本的ATAC和RNA数据
  • 文档与可视化文件
  • 示例文件:pl.frag_size_distr.pdf、pl.spectral_eigenvalues.pdf、pl.umap.svg
  • 内容:PDF格式的片段大小分布、特征值分析图表,SVG格式的UMAP降维可视化结果
  • 其他文件
  • 示例文件:merged_peaks.tabular(合并峰表)、cre_hea.bed(调控元件位置文件)、pbmc_500_chr21_subsample.bam(测序比对文件)
  • 内容:存储实验结果的表格、基因组区域注释及测序原始数据

适用场景

  • 生物信息学工具测试:验证Galaxy IUC平台上SnapATAC2工具的功能完整性与流程稳定性
  • 单细胞ATAC-seq数据分析流程验证:复现细胞过滤、特征构建、聚类等标准分析步骤
  • 多组学数据整合研究:探索ATAC-seq与RNA-seq数据的联合分析方法
  • 基因组调控元件研究:基于标记区域与合并峰数据,分析细胞类型特异性调控元件
  • 生物信息学教学:作为单细胞表观基因组学数据分析的教学案例数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 75.68 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。