数据集概述
该数据集整合了来自NCBI、ENA、BV-BRC等数据库的抗生素药敏数据,每条记录对应单个样本针对特定抗生素的药敏试验结果,包含14个核心字段,为抗生素耐药性研究提供结构化数据支持。
文件详解
- 文件名称: antibiograms.tsv.zip
- 文件格式: ZIP压缩包(内含TSV文件)
- 字段映射:
- biosample: NCBI BioSample数据库样本唯一标识
- sra_biosample: NCBI SRA样本数据库标识列表(空格分隔)
- species: 样本所属物种(含亚种信息)
- antibiotic: 测试抗生素名称
- phenotype: 药敏试验表型结果
- measurement_sign: 原始结果符号(依赖检测方法)
- measurement_value: 原始结果数值(依赖检测方法)
- measurement_units: 原始结果单位
- typing_method: 药敏检测技术名称
- typing_platform: 药敏检测平台名称
- standard: 表型解释标准
- genomes: 基因组数据库标识列表(空格分隔,含GCA_、BVBRC_等前缀)
- reads: NCBI SRA测序数据运行标识列表(空格分隔)
- read_type: 测序数据类型列表(与reads字段长度一致)
- 文件名称: gn-genomes.zip
- 文件格式: ZIP压缩包
- 包含内容: 额外基因组数据及关联药敏元数据(内含metadata.xlsx文件)
数据来源
NCBI、ENA、BV-BRC
适用场景
- 抗生素耐药性模式分析: 研究不同物种对各类抗生素的耐药/敏感表型分布
- 耐药基因关联研究: 结合基因组数据探索耐药表型与基因型的对应关系
- 药敏检测方法评估: 分析不同检测技术、平台及标准对结果的影响
- 公共卫生监测: 整合多源数据监测区域或全球抗生素耐药性流行趋势