ChemDiv_ChEMBL_DUD_E_深度学习分子对接研究数据集

数据集概述

本数据集为论文《Exploration on Learning Molecular Docking with Deep Learning Models》配套数据,包含ChemDiv聚类化合物、训练集对接分数、DUD-E验证化合物与受体、ChEMBL随机化合物及活性化合物等数据,支撑深度学习分子对接模型的训练与验证。

文件详解

  • Additional file 2.zip
  • 文件格式:ZIP(包含MOL2、CSV文件)
  • 字段映射介绍:包含ChemDiv数据库中聚类化合物的MOL2结构文件和CSV属性文件
  • Additional file 3.zip
  • 文件格式:ZIP(包含CSV文件)
  • 字段映射介绍:包含训练集1和训练集2针对各靶点的分子对接分数数据
  • Additional file 4.zip
  • 文件格式:ZIP(包含SMILES、MOL2、SDF、PDB文件)
  • 字段映射介绍:包含DUD-E数据库验证用化合物的SMILES、MOL2、SDF结构文件及受体的PDB结构文件
  • Additional file 5.zip
  • 文件格式:ZIP(包含SMILES文件)
  • 字段映射介绍:包含从ChEMBL数据库随机选取的50万种化合物的SMILES结构数据
  • Additional file 6.zip
  • 文件格式:ZIP(包含SMILES文件)
  • 字段映射介绍:包含ChEMBL数据库中针对各靶点的活性化合物SMILES结构数据

数据来源

论文《Exploration on Learning Molecular Docking with Deep Learning Models》

适用场景

  • 深度学习模型训练: 用于构建和训练分子对接预测的深度学习模型
  • 分子对接算法验证: 基于DUD-E验证集评估模型的分子对接预测性能
  • 化合物库筛选: 利用ChEMBL活性化合物数据开展靶点特异性化合物筛选研究
  • 药物发现研究: 支撑药物研发领域中分子结构与靶点相互作用的机制分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 526.87 MiB
最后更新 2026年1月23日
创建于 2026年1月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。