数据集概述
本数据集为《同源基因对系统发育基因组学研究的影响——以环节动物亲缘关系为例》研究的配套数据,包含用于环节动物系统发育分析的串联数据集与单分区数据集,涉及同源基因错误分组对系统发育重建结果的影响验证,支持相关生物信息学分析。
文件详解
- README_for_Struck_PLOSone2013.txt
- 文件格式:TXT
- 字段映射介绍:数据集说明文档,包含数据用途、文件结构及内容描述,提及串联数据集(如AD.phy、CPr.phy等11个文件)的来源与处理逻辑,说明数据修剪规则(如删除污染序列)。
- Struck_PLOSone2013.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包文件,包含研究使用的所有系统发育分析数据集,内部含“Concatenated_datasets”文件夹,存放串联数据集文件(如AD.phy、CPr.phy),文件格式为phylip。
数据来源
论文“The impact of paralogy on phylogenomic studies - a case study on annelid relationships”
适用场景
- 系统发育基因组学方法验证: 分析同源基因错误分组对基于超级矩阵法的系统发育重建结果的影响。
- 环节动物亲缘关系研究: 利用串联数据集与单分区数据,探究环节动物(如Owenia、Scoloplos等类群)的系统发育位置。
- 同源基因检测方法评估: 验证单分区分析、Bootstrap支持度筛选、BLAST搜索等方法在检测错误分组同源基因中的有效性。
- 生物信息学数据集应用: 为系统发育分析工具(如基于phylip格式的软件)提供标准化测试数据。