数据集概述
本数据集是应用R软件(robust-clustering-metagenomics)对4个已发表的纵向微生物组数据集进行稳健子状态聚类分析的输出结果,包含不同分类单元子集(如优势/非优势 taxa、属水平聚合)的聚类文件,支持微生物组动态模式及状态转换的研究。
文件详解
- 根目录文件
- 文件名称:readme.txt
- 文件格式:TXT
- 字段映射介绍:说明数据集背景、软件来源、前缀(数据集标识)和后缀(分类单元子集类型)规则
- 文件名称:robustClusteringSubstatesMetagenomics.output.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包包含各数据集聚类结果文件夹,每个文件夹对应1个原始数据集+分类单元子集的组合
- 文件夹内输出文件(每个组合对应3个文件)
- 文件名称:data.normAndDist_definitiveClustering_XXX.RData
- 文件格式:RData
- 字段映射介绍:包含phyloseq对象(OTU表、元数据、样本聚类标签)和距离矩阵对象
- 文件名称:definitiveClusteringResults_XXX.txt
- 文件格式:TXT
- 字段映射介绍:聚类评估指标文本文件
- 文件名称:sampleId-cluster_pairs_XXX.txt
- 文件格式:TXT(逗号分隔)
- 字段映射介绍:两列数据,分别为sampleID(样本ID)和clusterID(聚类ID)
数据来源
WilkinsonLab的R软件(https://github.com/wilkinsonlab/robust-clustering-metagenomics)及关联论文
适用场景
- 微生物组子状态识别研究:用于验证自动聚类方法在不同纵向数据集上的稳健性和适用性
- 微生物组动态分析:基于聚类结果探究微生物群落的状态转换模式与演化规律
- 生物信息学聚类算法评估:通过definitiveClusteringResults文件中的指标对比不同聚类策略的性能
- 微生物组分类单元分析:分析优势/非优势 taxa、属水平聚合对聚类结果的影响,优化研究目标适配性