数据集概述
本数据集为后生动物系统发育研究的基因组数据,包含1080个直系同源基因座,源自36个公开基因组,覆盖主要动物类群。数据用于优化系统发育信号分区,支持栉水母作为其余后生动物姊妹群的结论,提供基因组系统发育分析的工作流与工具,共15个文件。
文件详解
- RAxML_single_genes.zip
- 文件格式:ZIP
- 内容:单基因RAxML分析结果压缩包
- gene_stats.xlsx
- 文件格式:XLSX
- 内容:基因统计信息表格
- Binned_analyses.zip
- 文件格式:ZIP
- 内容:分箱分析结果压缩包
- PartitionFinder.zip
- 文件格式:ZIP
- 内容:PartitionFinder分区分析结果压缩包
- taxa.xlsx
- 文件格式:XLSX
- 内容:分类单元信息表格
- single_gene_alignments.zip
- 文件格式:ZIP
- 内容:单基因序列比对结果压缩包
- Progressive_concatenation.zip
- 文件格式:ZIP
- 内容:渐进式序列拼接结果压缩包
- OrthologID.zip
- 文件格式:ZIP
- 内容:直系同源基因识别结果压缩包
数据来源
论文“Extracting phylogenetic signal and accounting for bias in whole-genome data sets supports the Ctenophora as sister to remaining Metazoa”
适用场景
- 后生动物系统发育研究: 分析早期分支后生动物类群的亲缘关系,验证栉水母的系统发育位置
- 基因组系统发育信号提取: 优化直系同源基因座的系统发育信号分区,支持高分辨率系统发育分析
- 系统发育分析方法验证: 测试位点异质性模型、长枝吸引偏差评估等分析策略的有效性
- 生物信息学工具应用: 应用PartitionFinder、RAxML等工具进行基因组系统发育分析的工作流参考