找到25个数据集

分类: 公开数据 标签: PubChem

过滤结果
  • GNPS_Based_正离子模式质谱预处理数据集_2020

    2026年1月29日 30 31 13

    数据集概述 本数据集为从GNPS平台获取的正离子模式质谱数据经清洗和预处理后的成果,包含112,956条正离子模式光谱。其中92,954条光谱附带Smiles和InchiKey(前14字符有13,717个唯一值),可用于质谱分析相关研究。 文件详解...
    packageimg
  • ChemSearch_Based_原始化合物数据集_2023

    2026年1月29日 0 31 5

    数据集概述 本数据集为ChemSearch研究的原始数据集,包含分别来源于ChEMBL和PubChem的两个化合物数据集。数据涵盖特定时间节点的化合物SMILES字符串,经随机打乱处理,可用于化学信息检索相关研究。 文件详解 文件名称:Datasets.zip 文件格式:ZIP 字段映射介绍:压缩包内包含两个数据集,分别为:...
    packageimg
  • Chemical_Based_分子结构特征与沸点离群值数据集

    2026年1月29日 0 6 2

    数据集概述 本数据集包含带编号的分子对象,核心变量为沸点(Y变量),其余为分子的结构特征,通过离群值列(值为1表示离群)标注约5%的已知离群分子(基于极性与非极性结构差异)。数据来源于已发表的沸点测量数据集及公共数据,结构特征由RDKit工具生成。 文件详解 文件名称:for_pub_chem_outlier_dataset.xlsx...
    packageimg
  • LOTUS_Initiative_开放天然产物研究生物化学树数据

    2026年1月28日 30 102 91

    数据集概述 本数据集来自LOTUS开放天然产物研究计划,包含基于冻结元数据构建的生物树和化学树,元数据来源示例为PubChem。数据集共包含两个JSON文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集。 文件详解 文件名称:tree_bio.json 文件格式:JSON...
    packageimg
  • NORMAN_SLE_S87_137种CECs氯化副产物清单数据

    2026年1月28日 0 47 36

    数据集概述 本数据集为NORMAN Suspect List Exchange中的S87清单(CHLORINETPS),包含137种新兴污染物(CECs)的氯化副产物及小分子消毒副产物信息,91%可通过LC-ESI-HRMS检测。数据集共6个文件,覆盖化学物质系统名称、分子式、质谱参数等核心属性,支持环境污染物识别与分析。 文件详解...
    packageimg
  • SMTRI_Based_RNA_motif靶向小分子预测模型与数据集

    2026年1月26日 30 189 13

    数据集概述 本数据集包含SMTRI及其他三种模型(XGBoost、NB、RFSMMA)的性能对比文档、训练测试集数据、模型文件及RNA motif与小分子相互作用数据,涉及RNALigands特性、训练测试集特征及模型文件等13个文件,支持RNA motif靶向小分子预测相关研究。 文件详解 文档类文件 文件名称:Predictions.docx...
    packageimg
  • S77_FCCDB_Based食品接触化学品数据库v5_0结构化数据

    2026年1月26日 30 194 44

    数据集概述 本数据集是NORMAN可疑物质清单交换平台(NORMAN-SLE)上的S77 FCCDB食品接触化学品数据库v5.0相关集合,包含从公开法规和行业清单提取的有意添加食品接触化学品信息,补充了CompTox和PubChem的结构信息,共6个文件,支持食品接触化学品多样性及危害特性的研究。 文件详解 变更日志文件...
    packageimg
  • S96_ECIPFAS_Based_PFAS结构公共资源补充数据_更新版

    2026年1月21日 30 6 3

    数据集概述 本数据集是ECI (UniLu) 提供的S96_ECIPFAS可更新列表,用于向NORMAN Suspect List Exchange等公共资源补充PFAS结构数据。数据源自S74_REFTPS数据集的PFAS条目,包含多份文件记录PFAS物质的唯一标识、结构信息及来源,支持用户贡献新PFAS数据至公共数据库。 文件详解...
    packageimg
  • S70_NORMAN_Source_环境研究所GC_EI_MS可疑物清单数据集

    2026年1月19日 30 49 41

    数据集概述 本数据集是NORMAN可疑物清单交换平台上的S70清单,由环境研究所提供,包含GC-EI-MS分析用的可疑化学物信息。数据以多种格式记录化学物的标识、结构和属性信息,可用于环境监测中的可疑物筛查与识别,共包含4个文件。 文件详解 文件名称:S70_EISUSGCEIMS_DTXSIDs.txt 文件格式:TXT...
    packageimg
  • S43_NEUROTOXINS_Based公共资源神经毒素整合数据集_2019

    2026年1月19日 30 106 74

    数据集概述 本数据集是NORMAN可疑物质清单交换平台中S43神经毒素清单的关联资源,包含从公共资源(如CompTox、Schymanski等研究)整合的神经毒物信息,涵盖化学标识、结构、来源及文献数据,共3个文件,支持神经毒理学相关研究。 文件详解 NEUROTOXINS_14022019.csv 文件格式:CSV...
    packageimg
  • S31_WRTMSD_Based_Wiley串联质谱数据化合物识别数据集_2019

    2026年1月15日 30 145 5

    数据集概述 本数据集是NORMAN可疑物清单交换平台中S31清单关联的Wiley串联质谱数据集合,包含QqTOF仪器采集的高质量串联质谱数据,由Herbert Oberacher开发。数据以三种格式存储,涵盖化合物的结构标识、质谱信息及相关属性,可用于化合物识别和质谱分析,总计包含3个文件。 文件详解 WRTMSD_InChIKeys.txt...
    packageimg
  • Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test

    2026年1月11日 30 178 28

    数据集概述 本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。 文件详解 文件名称:curated_test_set.json 文件格式:JSON 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:...
    packageimg
  • NORMAN_SLE_Supporting_Information_高分辨质谱可疑物筛查协作数据

    2026年1月11日 30 84 6

    数据集概述 本数据集为NORMAN可疑物清单交换(NORMAN-SLE)项目的支持信息,旨在促进欧洲及全球在高分辨质谱可疑物筛查领域的协作。包含5个文件,涵盖清单元数据、使用统计等内容,支持质谱分析中可疑物筛查的协作与数据共享。 文件详解 文件名称:12302_2022_680_MOESM1_ESM.csv 文件格式:CSV...
    packageimg
  • NORMAN_Suspect_List_Exchange_S44_STATINS_公共资源收集数据2019

    2025年12月30日 30 84 19

    数据集概述 本数据集是NORMAN可疑物质清单交换平台上S44清单对应的他汀类药物(降脂药物)集合,从公共资源中编译而来,包含他汀类药物的化学标识、结构信息及相关数据,共3个文件,覆盖TXT、CSV、XLSX三种格式。 文件详解 STATINS_InChIKeys_14022019.txt 文件格式:TXT...
    packageimg
  • 天然产物碳_13核磁共振预测数据集

    2025年12月20日 30 183 120

    数据集概述 该数据集包含211,280种天然产物的结构、属性及分类信息,通过RDKit生成二维结构,结合PubChem标识符补充名称,利用nmrshiftdb2关联碳-13 NMR化学位移值,采用三级分类体系,并在版本3中新增ACD/Labs计算的化学位移数据。 文件详解 文件名称:pnmrnp3.zip 文件格式:ZIP压缩包...
    packageimg
  • 人参皂苷F1生产相关多功能糖苷酶分子模拟数据集

    2025年12月16日 30 123 114

    数据集概述 该数据集包含人参皂苷F1生产相关的分子对接及动力学模拟数据,针对野生型β-葡萄糖苷酶BgDU及其DUase突变体与底物NG-R1、G-Rg1的结合动态及构象变化,开展了四组独立模拟研究,为糖苷酶结构工程改造提供数据支持。 文件详解 数据集包含四个核心文件夹,具体说明如下: - Docking Structure文件夹: -...
    packageimg
  • PubChem筛选数据提取的化合物谱矩阵数据集

    2025年12月12日 30 147 112

    数据集概述 本数据集包含从PubChem筛选数据中提取的化合物谱矩阵,涵盖不同来源(确证/初级实验)的多个矩阵文件,记录化合物库针对靶点组的实验结果,为化学信息学和化学基因组学应用提供数据支持。 文件详解 数据文件(CSV格式):...
    packageimg
  • 基于FairDataBR工具的PubChem氯喹分析数据集

    2025年12月11日 30 11 3

    数据集概述 本数据集是通过FairDataBR工具对PubChem化学数据库中氯喹相关数据进行分析的结果。涵盖化合物、物质、蛋白质、生物测定和专利五个类别,包含氯喹及其耐药相关转运蛋白、生物活性测定等信息,为氯喹相关研究提供数据支持。 文件详解 文件名称: Analise_PubChem_FairDataBR_v2.pdf 文件格式: PDF...
    packageimg
  • 单药治疗药物反应预测跨研究基准数据集

    2025年12月9日 30 29 15

    数据集概述 该数据集为单药治疗药物反应预测的跨研究基准数据,整合了细胞系药物反应、多组学、药物特征及建模分区数据。数据源于五个药理基因组学研究,经统一流程处理,包含药物反应指标、细胞系多组学信息、药物分子特征及训练验证测试分区文件。 文件详解 文件名称: csa_data.zip:压缩包格式,包含四类核心数据...
    packageimg