数据集概述
本数据集为人类肠道细菌集合(HiBC)的基因组序列数据,包含从人类肠道分离的细菌菌株的16S rRNA基因序列、基因组序列及培养条件,涵盖已知细菌及新物种菌株,定期更新。本次提供的是FASTA核苷酸格式的基因组序列压缩包,质粒序列位于文件末尾,已修正前期错误及分类学拼写问题。
文件详解
- 文件名称:HiBC_Genome_sequences_20240717.zip
- 文件格式:ZIP(压缩包)
- 内容说明:压缩包内包含HiBC菌株的基因组序列,以FASTA核苷酸格式存储;若菌株含质粒序列,质粒序列位于对应文件末尾;已修正Segatella sinensis CLA-AA-H117的基因组错误(现含103个contigs、3671232 nt)及Maccoya intestinihominis、Faecousia faecis的分类学拼写错误。
适用场景
- 肠道微生物基因组学研究:分析人类肠道细菌的基因组特征、物种多样性及进化关系。
- 新物种分类学验证:基于基因组序列对HiBC中的新物种菌株进行分类学确认与命名支持。
- 肠道菌群功能分析:通过基因组序列预测肠道细菌的代谢功能、耐药基因等生物学特性。
- 微生物培养条件关联研究:结合基因组数据与培养条件,优化肠道细菌的分离培养方法。
- 数据更新追溯:跟踪HiBC数据集的版本更新,验证修正后基因组序列的准确性。