数据集概述
本数据集包含通过SignalP 4.0工具对莱茵衣藻(Chlamydomonas reinhardtii)蛋白质序列进行In silico鉴定得到的理论信号肽数据。原始蛋白质序列来自美国能源部联合基因组研究所基因组门户,经SignalP 4.0分析后生成信号肽序列、成熟蛋白质序列、比对结果及注释表格等文件,共5个文件。
文件详解
- 文件名称:Chlre4_best_proteins_fasta_protein_woSP.fasta
- 文件格式:FASTA
- 字段映射介绍:包含未鉴定出信号肽的蛋白质成熟序列
- 文件名称:Chlre4_best_proteins_signalPeptide.fasta
- 文件格式:FASTA
- 字段映射介绍:包含鉴定出的信号肽序列
- 文件名称:Chlre4_best_proteins_signalPeptide_unique.fasta
- 文件格式:FASTA
- 字段映射介绍:包含去重后的唯一信号肽序列
- 文件名称:Chlre4_best_proteins_signalPeptide_unique.aln
- 文件格式:ALN
- 字段映射介绍:使用UGENE工具对唯一信号肽序列进行比对后的结果文件
- 文件名称:Signal Peptide Anotation from aligned.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含信号肽比对后的注释列表,其中理论测试的信号肽以橙色高亮显示
数据来源
美国能源部联合基因组研究所基因组门户(http://genome.jgi.doe.gov/)
适用场景
- 藻类蛋白质组学研究: 分析莱茵衣藻蛋白质的信号肽结构与功能
- 分泌蛋白预测: 基于信号肽序列预测莱茵衣藻的分泌蛋白
- 生物信息学算法验证: 验证SignalP 4.0工具在藻类信号肽预测中的准确性
- 蛋白质定位研究: 结合信号肽注释分析蛋白质的亚细胞定位机制
- 分子生物学实验设计: 为莱茵衣藻信号肽相关的湿实验提供候选序列