NGS数据_膜型丝氨酸蛋白酶底物库

数据集概述

该数据集为膜型丝氨酸蛋白酶(matriptase)底物库的下一代测序(NGS)数据,包含原始及注释序列(含Sort1至Sort4筛选轮次)、聚类变体等。数据揭示高效切割序列的富集情况,用于指导后续动力学及前药激活实验,支持蛋白酶激活前药优化研究。

文件详解

数据集包含十五个FASTA格式文件,均位于NGS data - matriptase substrate library/目录下,具体如下: - 原始数据文件:如Sort1output_rawdata.fasta、Sort4output_rawdata.fasta等,存储各筛选轮次的原始测序数据 - 注释数据文件:如Sort2output_annotated.fasta、Sort4output_annotated.fasta等,为注释后的序列数据 - 聚类注释数据文件:如Sort1output_annotated_cluster.fasta、Sort3output_annotated_cluster.fasta等,为聚类后的注释序列数据

适用场景

  • 蛋白酶底物序列分析:提取膜型丝氨酸蛋白酶底物基序,识别高频序列
  • 酶学研究:分析膜型丝氨酸蛋白酶的切割偏好性
  • 药物研发:指导蛋白酶激活前药的设计与优化
  • 分子生物学实验:为后续动力学及前药激活实验提供数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 122.45 MiB
最后更新 2025年11月26日
创建于 2025年11月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。