数据集概述
本数据集来自全球孢子采样项目,包含2768份空气真菌DNA样本,采集自全球47个户外地点,覆盖两年时间。每份样本提取自24立方米空气,经保守生物信息学流程筛选后得到27954个物种水平操作分类单元(OTU),并附带有概率分类信息。数据可用于分析真菌群落的空间与季节变化,已验证年均温对群落组成有显著影响。
文件详解
- 核心数据文件(CSV格式)
metadata.csv:样本元数据,包含采样地点、日期、时间、测序深度、经纬度、温度等信息
otu.table.csv:样本-物种OTU表,记录每个样本中各物种OTU的序列数
taxonomy.csv:OTU分类信息,包含每个物种OTU的概率分类结果
fungi_pseudophyla.csv:真菌假门ASV匹配信息,包含参考序列及分类信息
nonfungi_pseudophyla.csv:非真菌假门ASV匹配信息,包含ASV编号、假门分类、物种匹配等字段
- R数据文件(RData格式)
allData.RData:整合前三个CSV文件的R数据对象
site_data.RData:采样地点相关数据
sample_data.RData:样本相关数据
- 分析脚本(R格式)
S2_download_GBIF_data.R、S3_make_GBIF_maps.R、S4_compare_to_GBIF.R等:共6个R脚本,用于数据下载、可视化及分析
- 压缩包文件
bioinformatics_pipeline_outputs.zip:生物信息学流程输出结果压缩包
GSSP-data_v1.0.tar.gz:项目数据完整压缩包
protaxFungi.tgz:真菌分类数据库压缩包
数据来源
Global Spore Sampling Project
适用场景
- 全球真菌生物多样性研究:分析不同地理区域空气真菌群落的物种组成与多样性
- 气候与真菌群落关系研究:探究年均温等气候因素对真菌群落结构的影响
- 生物地理分布模式分析:解析真菌物种的空间分布规律及季节变化特征
- 空气微生物监测应用:开发基于空气孢子采样的真菌多样性监测技术
- 生物信息学方法验证:测试保守序列筛选流程在真菌多样性研究中的应用效果
- 全球变化生态学研究:评估气候变化对全球真菌群落动态的潜在影响