GNPS_Based_正离子模式质谱预处理数据集_2020

数据集概述

本数据集为从GNPS平台获取的正离子模式质谱数据经清洗和预处理后的成果,包含112,956条正离子模式光谱。其中92,954条光谱附带Smiles和InchiKey(前14字符有13,717个唯一值),可用于质谱分析相关研究。

文件详解

  • 文件名称:gnps_positive_ionmode_cleaned_by_matchms_and_lookups.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内含预处理后的正离子模式质谱数据,包含光谱信息及对应的Smiles、InchiKey等元数据;元数据经matchms工具清洗校正,并通过PubChem查询补充。

数据来源

Global Natural Products Social Molecular Networking(GNPS)平台

适用场景

  • 代谢组学质谱数据分析:用于正离子模式下代谢物的结构鉴定与谱图匹配研究。
  • 质谱数据预处理方法验证:作为Spec2Vec等算法的训练或测试数据,验证质谱数据处理模型的性能。
  • 天然产物分子网络构建:利用带注释的质谱数据构建化合物分子网络,挖掘天然产物关联。
  • 化学信息学研究:基于Smiles和InchiKey等结构信息,开展化合物结构与质谱特征的关联分析。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 320.98 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。