数据集概述
本数据集基于γ-变形菌属Shewanella的全基因组序列,围绕基因树与物种树二分法展开研究。包含从243个共线基因同源区域中选取的单基因及核心基因组共线基因集,通过最大简约法(MP)和最大似然法(ML)进行系统发育分析,探索基因同源性与特征同源性的差异,为分子系统学研究提供案例支持。
文件详解
- 压缩文件(.zip)
- 文件名称:one gene per lcb.zip、lcb 175.zip、lcb 27.zip、lcb 156.zip
- 文件格式:ZIP
- 字段映射介绍:包含Shewanella基因组中243个共线基因同源区域的单基因数据,以及3组核心基因组共线基因集(分别含15、17、23个基因)的系统发育分析相关数据
- 文本文件(.txt)
- 文件名称:Dikow&Smith_trees.txt
- 文件格式:TXT
- 字段映射介绍:记录最大简约法(MP)分析中单基因串联后的系统发育树拓扑结构,包含A_hydrophila、Al_macleodii、C_psychrerythraea等物种的分支关系信息
数据来源
论文“Complete genome sequences provide a case study for the evaluation of gene-tree thinking”
适用场景
- 基因组系统发育分析: 用于研究Shewanella属基因树与物种树的二分关系,评估基因作为系统发育单元的可靠性
- 基因同源性研究: 分析共线基因区域的同源性特征,区分基因同源性与特征同源性的差异
- 系统发育拓扑结构分析: 基于MP和ML方法产生的独特拓扑结构,探索基因树不一致性的机制
- 分子系统学方法验证: 为分子系统学中基因单元的应用提供案例参考,支持方法优化与改进