数据集概述
本数据集用于评估后生动物隔离生殖系对域间水平基因转移(LGT)的影响。通过分析900余种生物(细菌、古菌、真核生物)的单基因系统发育树,识别支持度良好的域间LGT事件,对比隔离生殖系出现前后的LGT模式差异,验证隔离生殖系是否为LGT障碍的假设。数据集包含3个文件,涉及双事件拓扑结构、基因列表及存在缺失比对数据。
文件详解
- Double_event_topologies.zip
- 文件格式:ZIP(压缩包)
- 内容说明:包含双事件拓扑结构相关数据,用于分析基因转移事件的系统发育关系
- OG_to_Protein_List.xlsx
- 文件格式:XLSX(Excel表格)
- 内容说明:包含直系同源组(OG)与蛋白质的映射列表,涉及后生动物与原核生物间的基因转移关联信息
- Presence_absence_alignments.zip
- 文件格式:ZIP(压缩包)
- 内容说明:包含基因存在缺失比对数据,用于分析不同生物类群中基因的分布情况
数据来源
论文“Assessing the effects of a sequestered germline on interdomain lateral gene transfer in Metazoa”
适用场景
- 后生动物进化研究: 分析隔离生殖系出现前后域间水平基因转移的模式差异,验证生殖系结构对LGT的影响机制
- 基因转移事件系统发育分析: 利用双事件拓扑结构数据,重建基因在原核生物与后生动物间的转移路径
- 生物信息学基因注释: 通过直系同源组与蛋白质映射列表,识别后生动物中源自原核生物的外源基因
- 进化生物学假设验证: 支持“隔离生殖系是LGT障碍”的假设检验,探究后生动物进化过程中基因交流的限制因素