数据集概述
本数据集围绕恒定速率生灭(crBD)模型先验在系统发育树拓扑推断中的局限性展开,包含模拟、分析及图表复现代码与补充文件,验证crBD树与实证树的拓扑差异,探究不同场景下模型的适用性与潜在偏差。
文件详解
该数据集包含多种格式的文件,具体说明如下:
- 代码文件(.r格式,6个):
- Imbalance_Simulation.R:可能用于不平衡树的模拟分析
- Simulation_And_Analysis.R:整体模拟与分析流程代码
- Supplementary_Fig_S1_Analysis.R:补充图S1的分析代码
- 其他.r文件:用于不同环节的R语言分析脚本
- 模型脚本文件(.rev格式,6个):
- MCMC_Revbayes_code_rate4.Rev:速率4下的RevBayes MCMC分析脚本
- tree_BD.Rev:生灭模型树相关脚本
- sub_JC.Rev:JC替代模型脚本
- 其他.rev文件:不同速率下的RevBayes分析脚本
- 工具脚本文件(.sh格式,4个):
- fasta_to_revbayes_code_rate4.sh:将fasta文件转换为RevBayes输入的速率4脚本
- fasta_to_iqtree_code.sh:将fasta文件转换为IQ-TREE输入的脚本
- 其他.sh文件:不同速率下的格式转换脚本
- 补充表格文件(.xlsx格式,2个):
- Supplementary_Table_S1.xlsx:补充表S1,可能包含实证树数据集信息
- Supplementary_Table_S3.xlsx:补充表S3,可能包含模拟或分析结果数据
- 文档文件:
- Supplementary_File.pdf:补充文件,可能包含研究细节或附加结果
- README.md:项目说明文档,介绍数据集内容与复现方法
适用场景
- 系统发育学研究:分析crBD模型先验对树拓扑推断的影响,优化模型选择
- 进化生物学模拟:复现不同进化速率下的树拓扑模拟与推断实验
- 生物信息学方法验证:测试生灭模型在系统发育分析中的局限性与适用性
- 统计模型偏差分析:探究低信息含量数据集下的系统发育树拓扑推断偏差