脱氧胞苷激酶家族蛋白功能预测生化验证数据集

数据集概述

本数据集为脱氧胞苷激酶家族蛋白功能预测的生化验证研究数据,基于ProteinCartography v0.5.0工具,以人源脱氧胞苷激酶(UniProt ID:P27707)为输入,整合3000个Foldseek结果和7000个BLAST结果,包含结构、预测结果及可视化文件,支持蛋白功能预测方法的验证分析。

文件详解

  • DCK_aggregated_UMAP_with_proteintype.html:HTML格式文件,为蛋白图谱的自定义可视化结果,展示蛋白类型的UMAP降维聚合分析。
  • Deoxycytidine_kinase_aggregated_features_pca_umap_with_proteintype.tsv:TSV格式文件,包含蛋白特征聚合数据,字段示例:protid(蛋白ID)、UMAP1/UMAP2(降维坐标)、pdb_origin(PDB来源)、TMscore_v_P27707(与P27707的结构相似性)、Protein names(蛋白名称)等。
  • Deoxycytidine_kinase.zip:压缩文件,包含更新后的配置文件、输入数据、所有Foldseek/BLAST结果的结构文件及ProteinCartography完整输出结果。

适用场景

  • 计算生物学研究:验证ProteinCartography工具在蛋白功能预测中的准确性与可靠性。
  • 结构生物学分析:探究脱氧胞苷激酶家族的结构特征与功能关联性。
  • 蛋白组学应用:开发或优化基于序列/结构的蛋白功能预测算法。
  • 生物化学实验设计:为脱氧胞苷激酶相关的体外功能验证实验提供数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 378.23 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。