数据集概述
本数据集为论文“Geometric morphometrics and paleoproteomics in tandem enlighten the paleodiversity of Pongo”的系统发育树构建所用数据,包含古蛋白质序列、参考数据集及序列比对结果,支持对猩猩(Pongo)古生物多样性的研究,总计含多个文件及子文件夹。
文件详解
- 根目录文件
- 文件名称:Data.zip
- 文件格式:ZIP
- 内容说明:压缩包内包含以下子文件及子文件夹
- Ancient_Sequences.fa
- 文件格式:FASTA
- 字段映射介绍:包含本研究中重建的所有古蛋白质序列,对应15个猩猩化石样本
- Raw_Reference_Dataset文件夹
- 包含文件:9个FASTA文件
- 内容说明:每个文件对应一种蛋白质的参考序列,涵盖6个人类、27个猩猩、30个大猩猩、38个黑猩猩、2个猕猴、1个长臂猿、1个鼠狐猴、1个狒狒样本
- Alignments文件夹
- 包含文件:9个以蛋白质命名的FASTA文件 + CONCATENATED.fa
- 内容说明:
- 蛋白质命名FASTA:对应蛋白质的参考数据集与古样本序列比对结果
- CONCATENATED.fa:所有蛋白质序列的拼接、比对结果,已完成异亮氨酸/亮氨酸(I/L)修正
数据来源
论文“Geometric morphometrics and paleoproteomics in tandem enlighten the paleodiversity of Pongo”
适用场景
- 古生物多样性研究: 分析猩猩(Pongo)的古生物多样性及演化历史
- 系统发育树构建: 基于古蛋白质序列和参考数据集构建物种系统发育关系
- 古蛋白质组学分析: 研究古生物样本的蛋白质序列特征及演化规律
- 物种分类学研究: 结合形态测量学与古蛋白质组学数据,完善猩猩属的分类体系
- 演化生物学分析: 探究猩猩与其他灵长类物种的亲缘关系及时空演化模式