TernaryDB三元复合物数据集

数据集概述

该数据集是从蛋白质数据银行(PDB)中筛选出的22,303个三元复合物综合数据集,用于支持基于深度学习的靶向蛋白降解(TPD)复合物结构预测研究。

文件详解

  • 文件名称: TernaryDB.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 包含22,303个符合筛选条件的三元复合物数据,每个复合物由两个蛋白质和一个小分子组成,数据经过严格过滤(如X射线晶体学实验方法、分辨率等),并通过蛋白质序列相似性聚类避免数据泄露。

数据来源

Protein Data Bank (PDB)

适用场景

  • 计算结构生物学研究: 用于开发和验证TPD复合物结构预测的深度学习模型
  • 药物研发应用: 分析三元复合物的化学空间特征,支持PROTAC类药物设计
  • 生物信息学分析: 研究不同物种蛋白质与小分子的相互作用模式
  • 机器学习算法优化: 基于三元复合物数据改进结构预测模型的泛化能力
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.59 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。