数据集概述
本数据集包含北太平洋三种部分同域分布虎鲸生态型的全基因组单核苷酸多态性(SNP)数据,用于研究其复杂的祖先起源。数据通过多位点溯祖树、混合图重建及f4统计等方法分析,揭示生态型间的进化关系、祖先混合事件及不完全谱系分选现象,总计包含十四份文件。
文件详解
- XML文件(5个)
- 文件名称:Rad_orca_subsample1.xml、Rad_orca_subsample2.xml、Rad_orca_subsample3.xml、Rad_orca_subsample4.xml、Rad_orca_subsample5_10individs.xml
- 文件格式:XML
- 字段映射介绍:包含虎鲸样本的基因组SNP数据子样本元数据信息
- Trees文件(5个)
- 文件名称:Rad_orca_subsample1.trees、Rad_orca_subsample2b_1M.trees、Rad_orca_subsample3_1M.trees、Rad_orca_subsample4_1Mb.trees、Rad_orca_subsample5_10individs_1M.trees
- 文件格式:未指定(trees格式)
- 字段映射介绍:多位点溯祖树分析结果,记录基因组SNP的谱系关系
- VCF文件(2个)
- 文件名称:Repeat_filtered.vcf、Repeat_linkage_filtered.vcf
- 文件格式:VCF
- 字段映射介绍:过滤后的基因组SNP变异数据,包含重复序列过滤及连锁不平衡过滤后的位点信息
- TXT文件(1个)
- 文件名称:treemix_input.txt
- 文件格式:TXT
- 字段映射介绍:TreeMix分析输入数据,包含SNP位点的基因型信息及种群分组数据
- 其他文件(1个)
- 文件名称:STRUCTURE_INPUT
- 文件格式:未指定
- 字段映射介绍:STRUCTURE种群结构分析输入数据
数据来源
论文“Genome-wide SNP data suggests complex ancestry of sympatric North Pacific killer whale ecotypes”
适用场景
- 虎鲸种群遗传结构分析:利用VCF文件中的SNP数据研究北太平洋虎鲸生态型的遗传分化与种群结构
- 进化关系重建:通过trees文件的溯祖树结果,分析虎鲸生态型间的谱系关系及不完全谱系分选现象
- 祖先混合事件研究:使用TreeMix输入数据及分析结果,探究生态型间的基因流与祖先混合历史
- 基因组变异机制分析:结合过滤后的SNP数据,揭示虎鲸生态型复杂祖先起源的基因组学机制
- 生物地理学研究:基于种群遗传数据推断北太平洋虎鲸生态型的殖民历史与二次接触事件