数据集概述
本数据集是NORMAN Suspect List Exchange平台上S75列表对应的CyanoMetDB蓝细菌次级代谢产物综合数据库2024年发布版本。数据由人工从原始文献中整理,包含蓝细菌次级代谢产物的多维度信息,支持代谢组学分析、化合物鉴定等研究需求,共包含4个文件。
文件详解
- CyanoMetDB_Version03.xlsx
- 文件格式:XLSX
- 字段映射介绍:蓝细菌次级代谢产物综合数据库的主文件,包含代谢产物的基本信息、分类、分子属性等核心数据
- CyanoMetDB_V03_2024.csv
- 文件格式:CSV
- 字段映射介绍:包含CyanoMetDB_Identifier、NPAtlas_ID、InCyanoMetDB_since、CompoundName、Synonyms、Compound_Class等字段的结构化数据
- CyanoMetDB_V03_2024_MetFrag.csv
- 文件格式:CSV
- 字段映射介绍:为MetFrag工具优化的精简格式文件,包含Identifier、CompoundName、Synonyms、Compound_Class、MolecularFormula、MonoisotopicMass、SMILES、InChI、InChlKey、PubChemCID等字段
- CyanoMetDB_V03_2024_InChIKeys.txt
- 文件格式:TXT
- 字段映射介绍:包含蓝细菌代谢产物的InChIKey标识符列表,用于快速匹配和可疑化合物标记
数据来源
NORMAN Suspect List Exchange平台S75列表,原始文献Jones et al (2021)及Janssen et al (2024)
适用场景
- 蓝细菌代谢组学研究:用于鉴定和分析蓝细菌产生的次级代谢产物种类及分子特征
- 环境污染物筛查:通过InChIKey快速匹配环境样品中的蓝细菌代谢产物,支持可疑化合物标记
- 化学生物学分析:利用分子属性数据研究蓝细菌代谢产物的结构-活性关系
- 代谢组学工具应用:为MetFrag等代谢组学分析工具提供标准化的化合物参考数据库
- 微生物天然产物开发:挖掘蓝细菌次级代谢产物的潜在应用价值,如药物先导化合物筛选