数据集概述
本数据集包含非洲南方傍人(Paranthropus robustus)的牙釉质蛋白序列、参考数据及序列分析结果,源于相关研究论文。数据涵盖原始未对齐序列、参考数据集及系统发育分析数据集与树结构,支持傍人种群的生物性别鉴定和遗传多样性研究。
文件详解
- Paranthropus_Raw_AA_Sequences_Unaligned文件夹
- 文件名称:Paranthropus_Unaligned.fasta、Paranthropus_Unaligned_UNFILTERED.fasta
- 文件格式:FASTA
- 字段映射介绍:前者为所有用于分析的傍人未对齐氨基酸序列;后者为筛选前的原始序列(未用于分析)。
- Reference_Datasets文件夹
- 文件名称:3个FASTA文件
- 文件格式:FASTA
- 字段映射介绍:包含至少一种分析中使用的参考数据集,样本来源和信息见论文补充文档。
- Phylogenetic_Analysis_Datasets_and_Trees文件夹
- 子文件夹1:Paranthropus_Alignments_All_Datasets,含3个子文件夹,每个子文件夹包含傍人与参考数据集的对齐及I/L校正多序列比对(MSA)
- 子文件夹2:Paranthropus_Diversity_Dataset_Trees_Results,含各蛋白质的对齐序列、系统发育树,CONCATENATED子文件夹含串联对齐序列与树,BEAST2-STARBEAST3子文件夹含Starbeast3分析文件(xml、日志、树、分类单元文件)
- 子文件夹3:Paranthropus_Representative_Dataset_Trees_Results,含各蛋白质的对齐序列、系统发育树,CONCATENATED子文件夹含串联对齐序列与树,BEAST2子文件夹含时间校准分析文件,Distance_Matrix子文件夹含距离矩阵及热图生成R脚本
- 子文件夹4:Paranthropus_Independent_Dataset_Trees_Results,含独立参考数据集分析用的nexus文件和树图
- 子文件夹5:Tree_Figures,含3个子文件夹及1个额外图,每个子文件夹对应一种参考数据集的系统发育树图
- 压缩文件
- 文件名称:Paranthropus_Suplementary.zip
- 文件格式:ZIP
- 字段映射介绍:包含上述所有数据集及分析结果的压缩包
数据来源
论文“Enamel proteins reveal biological sex and genetic variability within southern African Paranthropus”
适用场景
- 古人类生物性别鉴定: 利用牙釉质蛋白序列特征分析傍人群体的生物性别组成
- 古人类遗传多样性研究: 通过序列比对与系统发育分析,探究傍人种群的遗传变异模式
- 古人类系统发育关系构建: 基于多序列比对和系统发育树,分析傍人与其他古人类的演化关系
- 牙釉质蛋白基因功能研究: 结合参考数据集,解析傍人牙釉质蛋白的基因功能与适应性进化