af2rave_基于物理采样的蛋白质集合生成数据集

数据集概述

本数据集是“af2rave: 基于物理采样的蛋白质集合生成”项目的代码与数据集合,包含针对ADK、DDR1、RBD三种蛋白质的AlphaFold预测结构、晶体结构、分析脚本及模型文件,以PDB格式为主,为蛋白质结构动态研究提供数据支持。

文件详解

该数据集按蛋白质类型分类存储,具体说明如下: - 蛋白质分类目录(ADK/、DDR1/、RBD/): - 每个目录下包含alphafold/子目录:存储蛋白质结构文件(.pdb格式)、序列文件(.fasta、.a3m格式)及配置文件(config.json) - 分析脚本文件:如angles.py、projection.py等Python代码,feature_selection.ipynb等Jupyter Notebook分析文件 - 模型与数据文件:如spib_model.pickle模型文件、data.npy数据文件、free_energy_20.pkl自由能数据文件 - 晶体结构目录(crystal/):存储蛋白质晶体结构文件(如4ake_A.pdb) - 轨迹分析目录(long_traj_analysis/):存储轨迹分析脚本(如rmsd.ipynb)与结果文件(rmsd.pkl) - 种子结构目录(seed_structures/):存储蛋白质初始结构文件(如boxed_pred_207_msaauto.pdb) - 时间结构独立成分分析目录(tica/):存储分析脚本(如tica.ipynb)、模型文件(tica_model_20.pkl)与自由能文件(free_energy_20.pkl) - 主要文件类型: - .pdb:蛋白质结构文件(占比约百分之九十八点八六) - .ipynb:Jupyter Notebook分析文件 - .py:Python代码文件 - .npy:NumPy数据文件 - .pkl/.pickle:模型或数据序列化文件 - .fasta/.a3m:蛋白质序列文件 - .json:配置文件

适用场景

  • 计算结构生物学研究:分析蛋白质结构动态变化与构象集合
  • 蛋白质功能预测:基于结构集合探究蛋白质功能机制
  • 药物设计:研究蛋白质与配体结合的结构基础
  • 生物信息学方法开发:验证物理采样方法在蛋白质结构预测中的应用效果
  • 蛋白质组学分析:整合多源蛋白质结构数据开展系统研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 254.89 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。