数据集概述
本数据集包含应用CORAL(常见到稀有迁移学习)方法的脚本与数据,用于分析马达加斯加节肢动物的分布预测。提供三个演示案例,从模拟数据测试到完整论文分析复现,支持不同计算资源需求的模型应用。
文件详解
- 演示脚本文件:
- D01_software_demo_simulate_data.Rmd:生成包含100物种、200采样单元的模拟数据,输出allDataDemo.RData(环境预测因子、物种分布、进化树等)和trueValuesDemo.RData(真实参数值)
- D02_software_demo_apply_CORAL.Rmd:加载模拟数据,演示CORAL方法的先验信息、预测能力及参数估计
- MA_small_demo.Rmd:基于论文数据子集应用CORAL,评估模型拟合度并可视化物种响应
- 完整分析脚本文件:
- S01-S11系列.R文件:覆盖Hmsc模型定义、后验导入、CORAL先验构建、交叉验证、模型拟合与结果可视化(对应论文图表生成)
- P01-P03系列.R文件:预处理脚本,包括序列数据转换、气候数据下载、响应矩阵构建
- 数据文件:
- allData.RData:论文分析核心数据,包含元数据、物种分布矩阵、分类信息
- ENA_read_accessions.tsv:ENA数据库原始序列数据访问信息,含样本ID、访问号、下载链接
- 输出文件:
- 各Rmd文件对应的.html文件:展示脚本运行的预期输出结果
适用场景
- 生物多样性研究:分析马达加斯加节肢动物分布与环境因子的关联
- 迁移学习应用:测试CORAL方法在稀有物种分布预测中的性能
- 生态模型开发:基于Hmsc框架构建物种分布模型并验证预测能力
- 高通量数据分析:复现大规模物种数据集的预处理与模型拟合流程
- 文献复现研究:重现论文中CORAL方法的完整分析步骤与结果