蛋白质序列比对方法评估数据集

数据集概述

本数据集记录了对蛋白质序列比对方法的评估研究结果,重点对比统计共估计方法BAli-Phy与其他流行比对方法在模拟及生物基准数据集上的性能,分析其精度、召回率差异及潜在影响因素。

文件详解

  • 文件名称: S2-supplementary_information_spreadsheet_v5_resubmission.xlsx:Excel格式,可能包含研究的补充数据,如各比对方法在不同数据集上的具体性能指标(精度、召回率等)。
  • 文件名称: revision-systematic-biology-supplement.pdf:PDF格式,可能包含研究的补充说明文档,如实验设计细节、结果讨论或方法学补充。
  • 文件名称: data_for_dryad.zip:压缩包格式,可能包含研究中使用的原始或处理后的蛋白质序列数据集(如1192个生物基准数据集及120个模拟数据集)。

适用场景

  • 生物信息学方法研究:分析不同蛋白质序列比对方法的性能差异,优化算法选择。
  • 进化生物学研究:评估统计共估计方法在系统发育树构建中的适用性。
  • 计算生物学模型验证:探究模型误设、参考比对误差等因素对序列比对结果的影响。
  • 蛋白质组学应用:为蛋白质结构预测、家族鉴定等下游分析提供比对方法选择依据。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 14.39 MiB
最后更新 2025年12月23日
创建于 2025年12月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。