数据集概述
本数据集为构建头足类唾液腺复合蛋白质数据库的组学数据,包含五个子数据库(A、C、D、E、F)的蛋白质序列文件,覆盖普通章鱼唾液腺蛋白质组学分析、多物种转录组组装翻译等来源,支持计算机酶切和肽库生成研究。
文件详解
数据集包含一个目录下的五个FASTA格式文件,具体说明如下:
- 目录: Omics Datasets to Create a Composite Protein Database from Cephalopod Salivary Apparatus for In silico Enzymatic Digestion and Peptide Library Generation/
- 子文件列表:
- Database_A_original_19087.fasta: FASTA格式,来自普通章鱼唾液腺蛋白质组学分析的蛋白质数据库
- Database_C_original_2427.fasta: FASTA格式,基于UniProt数据库后生动物分类检索的蛋白质鉴定结果
- Database_D_original_84778.fasta: FASTA格式,16种头足类后唾液腺转录组组装翻译得到的蛋白质序列
- Database_E_original_5106635.fasta: FASTA格式,16种头足类后唾液腺转录组六框翻译未包含在Database D的蛋白质序列
- Database_F_original_720910.fasta: FASTA格式,普通章鱼转录组六框翻译未包含在Database A的蛋白质序列
适用场景
- 头足类分子生物学研究: 分析唾液腺蛋白质组组成与功能
- 生物信息学分析: 开展计算机酶切模拟与肽库构建
- 比较蛋白质组学: 比较不同头足类物种唾液腺蛋白质序列差异
- 蛋白质数据库构建: 整合多来源数据建立头足类专用蛋白质参考库