数据集概述
本数据集为论文《The Black Queen Hypothesis: evolution of dependencies through adaptive gene loss》的补充数据,包含支持该理论的微生物基因序列及分析文件。核心内容是与图1相关的katG基因序列数据,用于研究自由生活微生物通过适应性基因丢失形成依赖关系的进化机制,涉及FASTA格式序列文件和CSV格式距离数据。
文件详解
- README_for_BQH.txt
- 文件格式:TXT
- 字段映射介绍:数据集说明文档,包含数据背景、文件清单及用途描述,明确数据对应论文图1的两棵进化树,列出katG_Master.fasta、katG_tree.fasta、katG_Distance.csv等核心文件的内容说明。
- BQH.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包文件,包含论文补充数据的具体内容,根据README描述推测内部包含:
- katG_Master.fasta:FASTA格式,2011年7月6日从PeroxiBase.org获取的434条katG肽序列比对文件
- katG_tree.fasta:FASTA格式,从主比对文件中提取的15条katG序列,用于生成论文图1的进化树
- katG_Distance.csv:CSV格式,katG基因的距离数据(具体字段未完全展示)
数据来源
论文“The Black Queen Hypothesis: evolution of dependencies through adaptive gene loss”
适用场景
- 微生物进化理论验证:支持Black Queen Hypothesis的实证分析,研究适应性基因丢失如何驱动微生物依赖关系形成
- 基因组简化机制研究:分析自由生活微生物(如海洋浮游细菌)基因组简化的选择压力与进化路径
- 基因序列比对分析:利用katG基因序列数据开展微生物功能基因的进化关系研究
- 微生物群落互作分析:探索微生物群落中“受益者”与“帮助者”的依赖关系及公共物品驱动机制
- 进化树构建与分析:基于katG序列数据构建微生物进化树,研究物种间的亲缘关系与功能分化