数据集概述
本数据集为论文《Exploration on Learning Molecular Docking with Deep Learning Models》配套数据,包含ChemDiv聚类化合物、训练集对接分数、DUD-E验证化合物与受体、ChEMBL随机化合物及活性化合物等数据,支撑深度学习分子对接模型的训练与验证。
文件详解
- Additional file 2.zip
- 文件格式:ZIP(包含MOL2、CSV文件)
- 字段映射介绍:包含ChemDiv数据库中聚类化合物的MOL2结构文件和CSV属性文件
- Additional file 3.zip
- 文件格式:ZIP(包含CSV文件)
- 字段映射介绍:包含训练集1和训练集2针对各靶点的分子对接分数数据
- Additional file 4.zip
- 文件格式:ZIP(包含SMILES、MOL2、SDF、PDB文件)
- 字段映射介绍:包含DUD-E数据库验证用化合物的SMILES、MOL2、SDF结构文件及受体的PDB结构文件
- Additional file 5.zip
- 文件格式:ZIP(包含SMILES文件)
- 字段映射介绍:包含从ChEMBL数据库随机选取的50万种化合物的SMILES结构数据
- Additional file 6.zip
- 文件格式:ZIP(包含SMILES文件)
- 字段映射介绍:包含ChEMBL数据库中针对各靶点的活性化合物SMILES结构数据
数据来源
论文《Exploration on Learning Molecular Docking with Deep Learning Models》
适用场景
- 深度学习模型训练: 用于构建和训练分子对接预测的深度学习模型
- 分子对接算法验证: 基于DUD-E验证集评估模型的分子对接预测性能
- 化合物库筛选: 利用ChEMBL活性化合物数据开展靶点特异性化合物筛选研究
- 药物发现研究: 支撑药物研发领域中分子结构与靶点相互作用的机制分析