数据集概述
本数据集是NORMAN可疑物清单交换平台中S1清单关联的MASSBANK化合物集合,包含化合物基本信息、质谱数据及结构标识等内容,为化学物质分析与识别提供支持。
文件详解
该数据集包含4个文件,具体说明如下:
- 综合化合物数据文件:
- MassBankEU_Cmpds_11042017_wMS_DTXSIDs_03102017.xlsx: Excel格式文件,可能包含化合物详细信息,如NORMAN_ID、名称、SMILES结构、精确质量、分子式等字段。
- MassBankEU_Cmpds_11042017_wMS_DTXSIDs_03102017.csv: CSV格式文件,字段示例包括NORMAN_ID、NAME、SMILES、NEUTRAL_EXACT_MASS、FORMULA、StdInChI、CAS_RN、PUBCHEM_CID、InChIKey、DTXSID等。
- 碎片数据文件:
- MassBank_FRAGMENT FILE.zip: ZIP压缩文件,可能包含化合物碎片相关数据。
- 结构标识文件:
- MassBankEU_InChIKeys_17062019.txt: TXT格式文件,包含一系列InChIKey(国际化合物标识密钥)字符串。
数据来源
NORMAN Network、MassBank.eu
适用场景
- 环境化学分析: 用于识别和分析环境中存在的可疑化学物质。
- 质谱数据研究: 支持化合物质谱特征与结构关联的研究。
- 化学物质数据库补充: 为化学物质信息库提供标准化标识及属性数据。
- 毒理学研究: 辅助化合物毒性相关的数据分析与评估。