数据集概述
本数据集包含dix-seq分析流程中使用的USEARCH SINTAX分类器参考数据库,具体包括rdp_16s_v18_sp、PR2_4.14和unite_10.05.2021三个数据库,用于扩增子数据的物种分类注释。
文件详解
- 文件名称:unite_10.05.2021.zip
- 文件格式:ZIP
- 字段映射介绍:unite数据库压缩包,用于真菌等物种分类注释的参考序列数据集
- 文件名称:rdp_16s_v18_sp.zip
- 文件格式:ZIP
- 字段映射介绍:RDP数据库16S rRNA基因v18版本物种水平参考序列压缩包,用于原核生物分类注释
- 文件名称:PR2_4.14.zip
- 文件格式:ZIP
- 字段映射介绍:PR2数据库4.14版本参考序列压缩包,用于真核生物核糖体RNA基因分类注释
数据来源
预印本论文“Dix-seq: An integrated pipeline for fast amplicon data analysis”
适用场景
- 扩增子数据分析:用于dix-seq管道中通过USEARCH SINTAX算法进行物种分类注释
- 微生物群落研究:支持16S rRNA、ITS等扩增子数据的物种组成分析
- 生物信息工具验证:作为参考数据集评估USEARCH SINTAX分类器的注释准确性
- 多组学数据整合:为微生物组与其他组学数据的联合分析提供分类学基础