数据集概述
本数据集包含小肠结肠炎耶尔森氏菌的全基因组多位点序列分型(wgMLST)和核心基因组多位点序列分型(cgMLST)方案及相关数据。数据基于2018年8月检索的252个公开基因组和79个INNUENDO项目新菌株,经INNUca组装、chewBBACA处理后形成,含元数据、基因组组装结果、MLST方案文件及等位基因谱。
文件详解
- 元数据文件
- 文件名称:Metadata/Yenterocolitica_metadata.txt
- 文件格式:TXT
- 字段映射介绍:包含菌株的分离国家、年份、来源分类、宿主分类、血清型、生物型、致病型及经典pubMLST 7基因序列型等信息
- 基因组组装文件
- 文件名称:Genomes目录下的331个INNUca V3.1组装结果
- 文件格式:未明确(对应元数据列表菌株)
- 字段映射介绍:小肠结肠炎耶尔森氏菌菌株的基因组组装数据
- wgMLST方案文件
- 文件名称:Schema/Yenterocolitica_wgMLST_6344_schema.tar.gz
- 文件格式:tar.gz
- 字段映射介绍:chewBBACA格式的wgMLST方案,含6344个基因座
- cgMLST基因列表文件
- 文件名称:Schema/Yenterocolitica_cgMLST_2406_listGenes.txt
- 文件格式:TXT
- 字段映射介绍:wgMLST中筛选出的cgMLST基因列表,含2406个基因座(存在于99%以上基因组)
- wgMLST等位基因谱文件
- 文件名称:Allele_Profles/Yenterocolitica_wgMLST_alleleProfiles.tsv
- 文件格式:TSV
- 字段映射介绍:331株菌的wgMLST等位基因分型结果,缺失基因座按chewBBACA注释标注
- cgMLST等位基因谱文件
- 文件名称:Allele_Profles/Yenterocolitica_cgMLST_alleleProfiles.tsv
- 文件格式:TSV
- 字段映射介绍:331株菌的cgMLST等位基因分型结果,缺失基因座标注为0
数据来源
INNUENDO项目(含ENA/SRA公开基因组及PRJEB27020新菌株)
适用场景
- 微生物分型研究:用于小肠结肠炎耶尔森氏菌的wgMLST/cgMLST分型及菌株亲缘关系分析
- 流行病学调查:结合元数据追踪菌株的地理分布、宿主来源及致病型特征
- 基因组方案验证:评估chewBBACA生成的MLST方案在耶尔森氏菌中的适用性
- 病原监测应用:为临床及公共卫生领域的耶尔森氏菌监测提供标准化分型工具
- 微生物进化分析:基于核心基因组序列数据研究耶尔森氏菌的进化关系与种群结构