蛋白质稳定性预测多模型融合数据集ProteinStabilityPredictionMulti-ModelFusionDataset-cdeotte

蛋白质稳定性预测多模型融合数据集ProteinStabilityPredictionMulti-ModelFusionDataset-cdeotte

数据来源:互联网公开数据

标签:蛋白质, 稳定性预测, 机器学习, 蛋白质工程, 序列分析, 数据融合, 结构生物学, 生物信息学

数据概述: 该数据集包含多个蛋白质稳定性预测模型的结果,这些模型基于不同的算法和特征提取方法,用于评估蛋白质变异对稳定性的影响。主要特征如下: 时间跨度:数据集未明确标明时间范围,通常被视为静态数据集,用于模型训练和评估。 地理范围:数据主要关注蛋白质序列及其稳定性预测结果,不涉及地理位置信息。 数据维度:数据集包括多个CSV文件,每个文件对应一个模型,包含蛋白质序列ID(seq_id)和预测的稳定性变化值(tm)。具体的文件包括RSASA_wtcsv、DeMask_log2f_varcsv、mCSMcsv、RASPcsv、RSASA_mutcsv、SA_backbonecsv、XGB_v1csv、imut_seqcsv和SA_apolarcsv。每个文件都提供了针对同一蛋白质序列的不同预测结果。 数据格式:数据以CSV格式提供,便于进行数据分析和模型融合。 来源信息:数据来源于不同的蛋白质稳定性预测模型,这些模型可能基于不同的算法和数据集进行训练。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于蛋白质稳定性预测、蛋白质工程和结构生物学等领域的研究,可以用于比较不同预测模型的性能,探索模型融合方法,以及研究氨基酸突变对蛋白质稳定性的影响。 行业应用:可以为生物制药、酶工程等行业提供数据支持,用于优化蛋白质设计,提高蛋白质的稳定性。 决策支持:支持蛋白质工程项目的决策制定,加速新药研发和生物催化剂的开发。 教育和培训:作为生物信息学、机器学习等相关课程的辅助材料,帮助学生和研究人员理解蛋白质结构与功能的关系,学习蛋白质稳定性预测的方法。 此数据集特别适合用于探索不同预测模型结果之间的差异与关联,以及构建更准确的蛋白质稳定性预测模型,从而实现蛋白质设计和改造的目标。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.49 MiB
最后更新 2025年5月1日
创建于 2025年5月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。