数据集概述
本数据集为新热带区两栖动物遗传变异预测因素研究的补充材料,包含遗传序列、地理参考数据、气候与自然历史特征数据等。通过随机森林模型与系统发育广义线性混合模型,识别出分布范围大小、降水变异性等影响核苷酸多样性的关键预测因素,为两栖动物保护策略制定提供数据支持。
文件详解
- 文件名称:README.md,格式:Markdown,内容:数据集说明文档,介绍数据内容、来源及分析方法
- 文件名称:Tutorial_RetrievingCoords_AssociatedDNAseqs.pdf,格式:PDF,内容:DNA序列地理坐标检索教程文档
- 文件名称:MMRR_results,格式:无扩展名,内容:多元回归残差分析(MMRR)结果文件
- 文件名称:Appendix_S1-S4.pdf,格式:PDF,内容:附录文档,包含补充分析结果与图表
- 文件名称:R_scripts.zip,格式:ZIP,内容:R语言分析脚本压缩包,包含随机森林与系统发育模型代码
- 文件名称:MS_Fastas_Neotropic_species.tar.xz,格式:TAR.XZ,内容:新热带区物种线粒体DNA序列压缩包(共4,052条序列)
- 文件名称:MS_Occurrences_Neotropic_species.tar.xz,格式:TAR.XZ,内容:新热带区物种地理分布数据压缩包(含2,477条地理参考序列)
- 文件名称:neotropical_tree.tre,格式:TRE,内容:新热带区两栖动物系统发育树文件
- 文件名称:Table_S1.csv,格式:CSV,内容:物种水平汇总数据表,包含字段:物种名称、序列数量、核苷酸多样性、IBD/IBE结果、微生境类型、活动模式、体型、发育方式、海拔数据等
适用场景
- 进化生物学研究:分析两栖动物遗传多样性的环境与地理预测因素
- 生物地理学研究:探究新热带区物种分布范围与遗传变异的关系
- 保护生物学应用:识别高遗传多样性的两栖动物保护优先区域
- 机器学习应用:验证随机森林模型在生物数据预测中的有效性
- 系统发育分析:利用系统发育广义线性混合模型研究物种进化关系对遗传变异的影响