BenchStab蛋白稳定性突变预测比较数据集

数据集概述

本数据集为BenchStab工具配套数据,用于独立评估18种基于结构和4种基于序列的蛋白稳定性突变预测工具。数据来自FireProtDB的单点突变实验ΔΔG值,经UniRef50和SCOP聚类去重后得到289条记录,包含36种蛋白,其中约百分之二十八为稳定突变。

文件详解

  • 文件名称: dataset.csv
  • 文件格式: CSV
  • 字段映射: experiment_id(实验ID)、uniprot_id(UniProt蛋白ID)、pdb_id(PDB结构ID)、uniref50_id(UniRef50聚类ID)、mutation(突变信息)、chain(蛋白链)、DDG_gt(实验测定ΔΔG值)
  • 文件名称: benchstab_input.csv
  • 文件格式: CSV
  • 字段映射: pdb_id(PDB结构ID)、mutation(突变信息)、chain(蛋白链)
  • 文件名称: DDG distribution.png
  • 文件格式: PNG
  • 内容: 展示数据集ΔΔG值分布的图片

数据来源

FireProtDB

适用场景

  • 生物信息学研究: 用于蛋白稳定性突变预测工具的性能评估与比较
  • 计算生物学分析: 分析单点突变对蛋白稳定性的影响规律
  • 机器学习模型验证: 作为独立测试集验证新型蛋白稳定性预测模型
  • 蛋白质工程应用: 辅助研究蛋白突变设计的稳定性优化策略
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.04 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。