数据集概述
本数据集为Microproteins二级和三级结构预测方法研究的配套数据,包含44个Microproteins的结构预测结果及相关分析文件。Microproteins是由小开放阅读框编码的小型蛋白质,当前其结构特征文献信息较少,数据集为填补该领域空白提供支持。
文件详解
- 压缩文件组(archive_files)
- 文件名称:FASTA files.zip、Rosetta Structures.zip、Overlap Structures.zip、Experimental Structures.zip、I-TASSER Structures.zip、AlphaFold Structures.zip
- 文件格式:ZIP
- 字段映射介绍:分别存储Microproteins的FASTA序列数据、通过Rosetta、I-TASSER、AlphaFold工具预测的三级结构数据、实验验证结构数据及结构重叠分析数据
- 文档文件(document_files)
- 文件名称:Secundary Strructures Comparisons.docx
- 文件格式:DOCX
- 字段映射介绍:包含Microproteins二级结构的比较分析内容
数据来源
论文“Methods for Secondary and Tertiary Structure Prediction of Microproteins”
适用场景
- Microproteins结构特征研究:分析不同工具预测的二级、三级结构差异,探索Microproteins结构规律
- 蛋白质结构预测方法验证:对比Rosetta、I-TASSER、AlphaFold等工具对Microproteins的预测性能
- 生物信息学算法优化:基于实验结构数据优化Microproteins结构预测模型
- 蛋白质组学研究补充:为Microproteins功能分析提供结构层面的数据支持