GRML_Based_糖皮质激素受体活性预测化合物与QSAR模型数据集

数据集概述

本数据集包含糖皮质激素受体(GR)计算药物发现项目相关的形态库、QSAR模型及活性预测化合物。内容涵盖GRML和RML两个虚拟化合物库、IMG非专有库子集、模型训练集、训练后的分类与回归模型、活性预测形态化合物表及设计的GR活性配体表,共12个文件,支持药物发现领域的进一步分析与研究。

文件详解

  • 形态库(Morphing Libraries)
  • 文件名称:GRML_library.csv
  • 文件格式:CSV
  • 字段映射介绍:包含999,015个由Molpher生成的虚拟化合物,基于ChEMBL17和IMG库中GR配体的独特Bemis-Murcko骨架
  • 文件名称:RML_library.csv
  • 文件格式:CSV
  • 字段映射介绍:包含1,346,310个由Molpher生成的虚拟化合物,基于ZINC数据库随机选择的独特Bemis-Murcko骨架
  • IMG库(IMG library)
  • 文件名称:IMG_non_proprietary.csv
  • 文件格式:CSV
  • 字段映射介绍:包含12,956个化合物及其初筛B-scores的非专有IMG库子集
  • Molpher输入(Molpher inputs)
  • 文件名称:GR_inputs.csv
  • 文件格式:CSV
  • 字段映射介绍:包含204个用于创建GRML库的配体,来自ChEMBL17(95个)和IMG非专有数据集(109个),含id_structure、smiles字段
  • 文件名称:Random_inputs.csv
  • 文件格式:CSV
  • 字段映射介绍:包含249个用于创建RML库的随机ZINC化合物,含id_structure、smiles字段
  • 模型训练集(Model's training sets)
  • 文件名称:Model33_training_set.csv
  • 文件格式:CSV
  • 字段映射介绍:随机森林分类模型训练集,含865个化合物,来自ChEMBL33(738个)和IMG库非专有活性配体(127个)
  • 文件名称:Model17_training_set.csv
  • 文件格式:CSV
  • 字段映射介绍:随机森林分类模型训练集,含601个化合物,来自ChEMBL17(474个)和IMG库非专有活性配体(127个)
  • 文件名称:RFR_training_set.csv
  • 文件格式:CSV
  • 字段映射介绍:随机森林回归模型训练集,含89个符合GR药效团四特征的ChEMBL33化合物
  • 模型(Models)
  • 文件名称:Model33.pkl、Model17.pkl、RFR_models.pkl
  • 文件格式:PKL
  • 字段映射介绍:分别为基于ChEMBL33和IMG库训练的随机森林分类模型、基于ChEMBL17和IMG库训练的随机森林分类模型、100个用于排名活性形态的随机森林回归模型
  • 活性预测形态(Active predicted morphs)
  • 文件名称:all_morphs_actives_predicted.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:含两个工作表,分别为22,524个GRML活性预测形态和4,341个RML活性预测形态,包含QED、NIBR Severity Score、Molskill Score等字段
  • 设计的GR活性配体(Proposed GR active ligands)
  • 文件名称:designed_ligands.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:含两个工作表,分别为54个设计的GR配体(含QED、共识排名、手动注释等)和54个配体的结构信息

适用场景

  • 药物发现研究: 用于糖皮质激素受体靶向药物的虚拟筛选与活性预测
  • QSAR模型开发与验证: 基于训练集和模型文件,研究GR受体活性预测模型的构建与优化
  • 化学空间分析: 分析GRML和RML库中虚拟化合物的结构特征与多样性
  • 配体设计优化: 参考designed_ligands.xlsx中的配体信息,进行GR活性配体的设计与优化
  • 计算化学研究: 探索Molpher生成虚拟化合物的方法在药物发现中的应用
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 426.91 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。