数据集概述
本数据集为EukBank 18S V4数据集的首次发布版本,包含全球不同生物群落的一万两千六百七十二个 metabarcoding 样本数据,共识别出三十三万五千六百六十二个ASVs。数据集由七个核心文件构成,文件结构及相关方法详情可参考说明文档。
文件详解
- README.pdf: PDF格式文档,详细说明数据集的结构和关联方法
- eukbank_18S_V4_asvs.fasta.gz: GZ压缩的FASTA格式文件,可能包含ASVs序列信息
- eukbank_18S_V4_samples.tsv.gz: GZ压缩的TSV格式文件,可能包含样本信息
- eukbank_18S_V4_projects.md: MD格式文档,可能包含项目相关描述
- eukbank_18S_V4_clusters_comp.tsv.gz: GZ压缩的TSV格式文件,可能包含聚类组成信息
- eukbank_18S_V4_counts.tsv.gz: GZ压缩的TSV格式文件,可能包含计数数据
- eukbank_18S_V4_clusters_desc.tsv.gz: GZ压缩的TSV格式文件,可能包含聚类描述信息
- eukbank_18S_V4_asvs.tsv.gz: GZ压缩的TSV格式文件,可能包含ASVs相关数据
适用场景
- 生物群落多样性研究:分析全球不同生物群落的真核生物多样性分布
- 分子生态学研究:探究环境因素对真核生物群落结构的影响
- 生物信息学分析:开发或验证真核生物metabarcoding数据处理方法
- 生态监测:建立全球尺度真核生物多样性监测的基准数据集