数据集概述
本数据集围绕蛾类属Eupithecia的系统发育研究展开,对比了RAD测序与多基因座桑格测序的系统发育假设,分析了RAD数据的基因座缺失效应及其对系统发育信息(SNP、PIS)的影响,包含研究相关的代码、补充材料和图表文件。
文件详解
该数据集包含三类文件,具体说明如下:
- 代码文件(.r格式):
- bootstrap_DRYAD.R:用于计算节点自举支持率的R脚本
- dropout_DRYAD.R:分析基因座缺失效应的R脚本
- locus conservativeness_DRYAD.R:评估基因座保守性的R脚本
- 文档文件(.docx格式):
- Supplementary materials_Tables_S1.docx:补充材料表S1
- Supplementary materials_Tables_S2.docx:补充材料表S2
- Supplementary materials_Tables_S4.docx:补充材料表S4
- Supplementary materials_Tables_S7.docx:补充材料表S7
- 图表文件(.pdf格式):
- Fig.S1. ultrametric trees.pdf:超度量树图表
- Fig.S5. venn diagram of shared loci among species.pdf:物种间共享基因座的韦恩图
- Fig.S7. ADO (drop out bad quality samples).pdf:低质量样本缺失分析图表
- Fig.S8. rad_reference_assembly.pdf:RAD参考组装图表
- Fig.S10. SNP heatmap.pdf:SNP热图
- 其他PDF图表文件:包含基因座缺失、系统发育树等相关可视化内容
适用场景
- 系统发育基因组学研究:分析RAD测序与桑格测序在属级系统发育中的应用差异
- 基因座缺失效应分析:探究RAD数据中基因座缺失对SNP、PIS分布及系统发育信息的影响
- 分子系统学方法评估:比较不同测序技术在昆虫系统发育研究中的适用性
- 生物信息学方法验证:验证基因座保守性、自举支持率等分析方法的有效性