数据集概述
本数据集包含使用Medeller和RosettaCM算法预测古紫质3(arch-3)蛋白质结构所需的全部文件,支持从序列比对、模板处理到结构建模、优化及结果评估的完整流程,可用于生物信息学领域的蛋白质结构预测研究。
文件详解
- 核心输入文件
- 文件名称:
P96787.fasta、1UAZ.fasta
- 文件格式:FASTA
- 字段映射介绍:分别为目标蛋白arch-3(P96787)和模板蛋白1UAZ的氨基酸序列文件
- 模板结构文件
- 文件名称:
1UAZ_full.pdb
- 文件格式:PDB
- 字段映射介绍:模板蛋白1UAZ的完整三维结构文件,需重命名为
1UAZ.pdb使用
- 片段文件
- 文件名称:
P96787_3.frags、P96787_9.frags
- 文件格式:无扩展名(frags)
- 字段映射介绍:Rosetta算法所需的目标蛋白短片段结构文件
- 辅助信息文件
- 文件名称:
P96787.octopus
- 文件格式:.octopus
- 字段映射介绍:目标蛋白的结构辅助信息文件
- 算法说明文件
- 文件名称:
README_MEDELLER
- 文件格式:无扩展名
- 字段映射介绍:Medeller算法的使用说明文档,包含网页工具访问链接及操作指引
- 脚本与配置压缩包
- 文件名称:
GENERAL.zip
- 文件格式:ZIP
- 字段映射介绍:包含RosettaCM算法所需的脚本(grishex.script、thread.script等)、权重文件(stage1_membrane.wts等)及配置文件
适用场景
- 蛋白质结构预测研究:用于通过Medeller或RosettaCM算法构建古紫质3的三维结构模型
- 生物信息学算法验证:对比不同蛋白质结构预测算法的建模效果与效率
- 膜蛋白结构分析:基于古紫质3的建模流程,探索膜蛋白结构预测的关键参数与优化方向
- 结构生物学教学实践:作为蛋白质结构预测流程的示例数据集,用于生物信息学相关课程的实操教学