心脏离子通道小分子活性综合数据集

数据集概述

该数据集是一个面向药物发现领域的综合数据库,涵盖hERG、Nav1.5和Cav1.2三种心脏离子通道的小分子活性数据。数据以压缩文件形式组织,每个离子通道目标包含开发集(含训练/验证子集)及两个不同结构相似度阈值的外部测试集,为离子通道毒性预测模型的构建与评估提供标准化数据支持。

文件详解

  • 压缩文件:
  • dataset.rar: RAR格式压缩包,包含所有目标离子通道的子文件夹及数据文件
  • 可视化文件:
  • _upstream_source_composition.png: PNG格式图片,可能展示数据上游来源的构成情况
  • 离子通道目标子文件夹(以hERG为例):
  • 开发集文件(CSV格式): 含训练集(80%)和验证集(20%),用于模型超参数调优
  • 外部测试集文件1(CSV格式): 化合物与开发集结构相似度≤60%(Tanimoto系数)
  • 外部测试集文件2(CSV格式): 化合物与开发集结构相似度≤70%(Tanimoto系数)
  • 通用字段说明:
  • InChI Key: 化学结构唯一标识符
  • SMILES: 化学结构字符串表示
  • Source: 上游数据源
  • ChEMBL ID: ChEMBL数据库化合物标识符(如有)
  • PubChem CID: PubChem数据库化合物标识符(如有)
  • pIC50: 半数抑制浓度的负对数(反映化合物活性)
  • USED_AS: 标记化合物用于训练或验证

适用场景

  • 药物研发: 构建和评估心脏离子通道毒性预测模型,加速药物安全性筛选
  • 计算化学研究: 分析小分子结构与离子通道抑制活性的构效关系
  • 机器学习应用: 开发基于化学结构的定量构效关系(QSAR)模型
  • 药物安全性评估: 预测候选药物对心脏离子通道的潜在抑制作用,降低药物研发风险
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.4 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。