数据集概述
本数据集用于NPOmix验证研究,包含1040个PoDP配对样本的antiSMASH分析结果,以及21个已知生物合成基因簇(BGCs)的MGF代谢物谱图测试数据。antiSMASH输入数据为NCBI的FASTA基因组序列,来源于PoDP数据库。数据集仅保留了antiSMASH输出中BGCs的GenBank(.gbk)文件,共包含2个压缩文件。
文件详解
- 文件名称:21_mgfs_test1.zip
- 文件格式:ZIP
- 字段映射介绍:包含21个已知BGCs的MGF代谢物谱图测试文件,用于NPOmix验证研究。
- 文件名称:antismash_only_gbk.zip
- 文件格式:ZIP
- 字段映射介绍:包含1040个PoDP配对样本的antiSMASH分析结果,仅保留了BGCs的GenBank(.gbk)文件。
数据来源
论文“NPOmix: a tool for linking natural products to their biosynthetic gene clusters using metabolomics and genomics data”(具体以实际发表论文为准)
适用场景
- 生物合成基因簇(BGCs)分析: 利用antiSMASH结果中的GenBank文件,研究微生物基因组中的BGCs结构与功能。
- 代谢组学与基因组学关联研究: 通过MGF代谢物谱图与BGCs数据的整合,探索天然产物与其生物合成基因簇的关联。
- 生物信息学工具验证: 用于NPOmix等工具的性能验证与测试。
- 微生物天然产物研究: 分析PoDP配对样本中的BGCs分布与代谢物谱图特征,挖掘潜在的新型天然产物。