数据集概述
本数据集为自由基S-腺苷甲硫氨酸(rSAM)依赖酶序列空间扩展研究的补充数据,聚焦翻译后大环化相关酶的分析。包含5个支持信息数据集,涉及前体SSN簇Logo序列、放线菌环芳烃前体、小肽相邻酶分布等内容,为酶序列空间扩展研究提供结构化参考数据。
文件详解
- Supporting Information Dataset 1.zip
- 文件格式:ZIP
- 字段映射介绍:包含前体SSN中500个簇的Logo序列数据
- Supporting Information Dataset 2_3_4.xlsx
- 文件格式:XLSX
- 字段映射介绍:整合3个数据集内容,包括199个放线菌环芳烃前体、小肽相邻不同酶的分布、antiSMASH与PRISM-RiPP预测的rSAM成熟酶交叉比较分析
- Supporting Information Dataset 5_0.55_pre_out_cluster.tsv
- 文件格式:TSV
- 字段映射介绍:包含所有已识别前体的mmseq2输出数据,示例字段含proteo_pre_99964等前体标识信息
适用场景
- 酶序列空间扩展研究:分析rSAM依赖酶序列空间的扩展特征及翻译后大环化机制
- 微生物代谢产物研究:基于放线菌环芳烃前体数据,探究微生物来源的代谢产物合成规律
- 生物信息学预测工具验证:通过antiSMASH与PRISM-RiPP的交叉比较,评估rSAM成熟酶预测工具的性能
- 肽类化合物生物合成分析:结合小肽相邻酶分布数据,研究肽类化合物的生物合成路径及相关酶作用机制