数据集概述
本数据集包含硫氧化细菌外共生体(Thiobius)与近缘自由生活菌株(ODIII6)的基因组原始数据,通过宏基因组学与比较基因组学分析,探究宿主依赖对外共生体基因组演化的影响,涉及16S rRNA基因树、代谢通路及功能性状等核心内容。
文件详解
该数据集包含多种格式的文件,具体说明如下:
- 系统发育树文件(.nwk格式):
- 01.ML16S.redu.nwk:最大似然法构建的16S rRNA基因树(Newick格式),已修剪无可用基因组的分支
- 02.ML.16S.306seqs.100BS.nwk:R工作流程生成的最大似然16S rRNA基因树(含100次自举支持)
- 03.MP16S.redu.nwk:简约法构建的16S rRNA基因树(Newick格式)
- 04.MP.16S.306seqs.100BS.nwk:R工作流程生成的简约法16S rRNA基因树(含100次自举支持)
- 05.BI16S.redu.nwk:贝叶斯法构建的16S rRNA基因树(Newick格式)
- 06.BI16S.306seqs.nwk:贝叶斯法构建的16S rRNA基因树(含306条序列)
- 基因组信息文件(.csv格式):
- 10.Metagenomes.csv:宏基因组样本信息,字段包括GenomeID、MD5、FileSize、ReadPairs
- 15.ThiobiusMAGandODIII6.csv:共生体与自由生活菌株基因组特征,字段含ContigsNumber、N50、BUSCO完整性、GC含量等
- 09.TaxaSelection16S.csv:16S rRNA基因分析的分类单元选择列表
- 12.DNAextraction.csv:DNA提取实验相关数据
- 基因组注释文件(.tsv格式):
- 13.ThiobiusG43.curated.tsv:Thiobius基因组注释数据(已整理)
- 14.ODIII6.curated.tsv:ODIII6菌株基因组注释数据(已整理)
- 序列文件(.fna格式):
- 08.Phylogeny.16S.mafft.trimal.fna:经MAFFT比对、TrimAl修剪的16S rRNA基因序列文件
- 分析报告与代码文件:
- 18.Espada-Hinojosa_et_al_2022_PrimaryData.Rmd:R Markdown格式的分析代码与报告
- 19.Espada-Hinojosa_et_al_2022_PrimaryData.html:R Markdown生成的HTML报告
- README.md:数据集说明文档,含文件MD5校验值及内容描述
适用场景
- 微生物基因组演化研究:分析宿主依赖对外共生体基因组大小、代谢通路的影响
- 硫氧化共生体系研究:探究硫氧化细菌与宿主的互作机制及适应策略
- 比较基因组学分析:对比自由生活与共生微生物的功能性状差异
- 深海热液口微生物适应机制研究:解析环境不稳定性对微生物基因功能的选择压力
- 微生物系统发育分析:基于16S rRNA基因树研究硫氧化细菌的亲缘关系