数据集概述
本数据集基于最新版ChEMBL中的化合物,提供三种基于MMP的数据集:活性悬崖(MMP-cliffs)、结构活性关系(SAR)传输系列、基于逆合成规则的第二代MMPs(RECAP-MMPs)。数据以八种文件形式呈现,按靶点和Ki、IC50子集分类,采用规范SMILES表示结构信息。
文件详解
- 文件名称:mmp_data_sets.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包包含八个文件,对应三类数据集:MMP-cliffs(2个文件)、SAR传输系列(4个文件)、RECAP-MMPs(2个文件)。所有数据按靶点分类,分Ki和IC50子集,以规范SMILES表示化合物结构,包含活性悬崖、SAR传输系列(含近似或常规效价进展)及RECAP-MMPs的结构与活性信息。
数据来源
最新版ChEMBL数据库
适用场景
- 药物研发_SAR分析:用于研究化合物结构与活性的关系,识别活性悬崖和效价进展规律。
- 药物分子设计:基于逆合成规则的RECAP-MMPs数据,支持药物分子的结构优化与设计。
- 靶点特异性分析:按靶点和Ki、IC50子集分类的数据,可用于特定靶点的化合物活性研究。
- 药物活性预测模型构建:为机器学习模型提供结构化的MMP相关数据,支持活性预测模型开发。