INNUENDO_Based_小肠结肠炎耶尔森氏菌wgMLST与cgMLST数据_2018

数据集概述

本数据集包含小肠结肠炎耶尔森氏菌的全基因组多位点序列分型(wgMLST)和核心基因组多位点序列分型(cgMLST)方案及相关数据。数据基于2018年8月检索的252个公开基因组和79个INNUENDO项目新菌株,经INNUca组装、chewBBACA处理后形成,含元数据、基因组组装结果、MLST方案文件及等位基因谱。

文件详解

  • 元数据文件
  • 文件名称:Metadata/Yenterocolitica_metadata.txt
  • 文件格式:TXT
  • 字段映射介绍:包含菌株的分离国家、年份、来源分类、宿主分类、血清型、生物型、致病型及经典pubMLST 7基因序列型等信息
  • 基因组组装文件
  • 文件名称:Genomes目录下的331个INNUca V3.1组装结果
  • 文件格式:未明确(对应元数据列表菌株)
  • 字段映射介绍:小肠结肠炎耶尔森氏菌菌株的基因组组装数据
  • wgMLST方案文件
  • 文件名称:Schema/Yenterocolitica_wgMLST_6344_schema.tar.gz
  • 文件格式:tar.gz
  • 字段映射介绍:chewBBACA格式的wgMLST方案,含6344个基因座
  • cgMLST基因列表文件
  • 文件名称:Schema/Yenterocolitica_cgMLST_2406_listGenes.txt
  • 文件格式:TXT
  • 字段映射介绍:wgMLST中筛选出的cgMLST基因列表,含2406个基因座(存在于99%以上基因组)
  • wgMLST等位基因谱文件
  • 文件名称:Allele_Profles/Yenterocolitica_wgMLST_alleleProfiles.tsv
  • 文件格式:TSV
  • 字段映射介绍:331株菌的wgMLST等位基因分型结果,缺失基因座按chewBBACA注释标注
  • cgMLST等位基因谱文件
  • 文件名称:Allele_Profles/Yenterocolitica_cgMLST_alleleProfiles.tsv
  • 文件格式:TSV
  • 字段映射介绍:331株菌的cgMLST等位基因分型结果,缺失基因座标注为0

数据来源

INNUENDO项目(含ENA/SRA公开基因组及PRJEB27020新菌株)

适用场景

  • 微生物分型研究:用于小肠结肠炎耶尔森氏菌的wgMLST/cgMLST分型及菌株亲缘关系分析
  • 流行病学调查:结合元数据追踪菌株的地理分布、宿主来源及致病型特征
  • 基因组方案验证:评估chewBBACA生成的MLST方案在耶尔森氏菌中的适用性
  • 病原监测应用:为临床及公共卫生领域的耶尔森氏菌监测提供标准化分型工具
  • 微生物进化分析:基于核心基因组序列数据研究耶尔森氏菌的进化关系与种群结构
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 425.04 MiB
最后更新 2026年1月12日
创建于 2026年1月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。