数据集概述
该数据集为《Molecular Modelling Reveals Eight Novel Druggable Binding Sites in SARS-CoV-2's Spike Protein》一文的配套数据,包含DrugBank分子库、刺突蛋白受体结构、对接网格中心、结合位点坐标、建模结果及可视化文件,支持新冠病毒药物开发相关的分子建模研究。
文件详解
数据集为压缩包格式,内部包含多个目录和文件,具体说明如下:
- 分子库目录(DrugBank_2020_5.1.5/):
- DB_5.1.5_pH7.4_pdbqt/:PDBQT格式文件,可直接用于AutoDock Vina对接
- DB_5.1.5_pH7.4_mol2amber/:含GAFF原子类型和Gasteiger电荷的mol2文件
- DB_5.1.5_pH7.4_frcmod/:分子力学参数缺失的frcmod文件
- dbID_name.dat:DrugBank ID与通用名的映射字典
- 受体结构目录(receptors/):
- CS00ns.pdb:闭环重构后结构(基于PDB ID 6vxx)
- OS00ns.pdb:开环重构后结构(基于PDB ID 6vyb)
- CS25ns.pdb:闭环25ns分子动力学模拟后结构
- OS25ns.pdb:开环25ns分子动力学模拟后结构
- 对接网格中心目录(dockingCenters/):XYZ格式文件,含对接网格中心坐标
- 结合位点目录(bindingSites/):XYZ格式文件,含A-H共八个结合位点的原子中心坐标
- 建模结果文件:
- allData.txt:所有分子(获批+研究中)的建模结果,分号分隔列
- appData.txt:仅获批分子的建模结果,分号分隔列
- data.xlsx:所有分子建模结果的Excel表格
- 可视化文件:
- bs.pse:PyMOL会话文件,展示闭环结构中的结合位点
- pt.pse:PyMOL会话文件,展示闭环结构中的对接网格中心
数据来源
中东技术大学化学系(Department of Chemistry, Middle East Technical University)
适用场景
- 新冠病毒药物研发:筛选可与刺突蛋白新结合位点作用的潜在药物分子
- 分子建模方法验证:测试AutoDock Vina等对接工具在病毒蛋白靶点中的应用效果
- 病毒蛋白结构研究:分析刺突蛋白闭环/开环结构及分子动力学模拟后的构象变化
- 药物-靶点相互作用分析:探究获批药物与刺突蛋白结合位点的分子力学相互作用