数据集概述
本数据集包含25个犬品种、每个品种25个个体的基因组数据,围绕12个与犬类特定表型相关的因果突变位点,分析其群体基因组选择信号。通过测量因果突变频率识别受正选择的品种,作为阳性对照评估选择扫描统计方法的性能,涉及单倍型和核苷酸多态性模式分析。
文件详解
- 基因型数据文件
- 文件名称:
chr_1_to_38.imputed.tfam、chr_1_to_38.imputed.tped
- 文件格式:TFAM、TPED
- 字段映射介绍:包含25个犬品种共625个个体(25×25)的基因型数据,覆盖1至38号染色体的基因分型信息
- 样本信息文件
- 文件名称:
samples.txt
- 文件格式:TXT
- 字段映射介绍:记录样本标识信息,包含品种(如border_collie)和个体编号(如PFZ8D02)
- 选择扫描结果文件
- 文件名称:
H_results.zip、nSL_results.zip、CLR_results.zip、iHS_results.zip、Window_Scans_results.zip
- 文件格式:ZIP
- 字段映射介绍:分别存储H、nSL、CLR、iHS等选择扫描统计方法的分析结果,以及窗口扫描的结果数据
- 群体结构分析文件
- 文件名称:
chr_1_to_38.hapflk
- 文件格式:HAPFLK
- 字段映射介绍:用于犬类群体结构分析的基因型数据文件
数据来源
论文“Evaluating the performance of selection scans to detect selective sweeps in domestic dogs”
适用场景
- 犬类选择扫描方法评估: 以已知正选择位点为对照,测试H、nSL、CLR、iHS等统计方法检测选择信号的灵敏度与准确性
- 犬类基因组选择信号分析: 研究人工选择在犬驯化过程中留下的单倍型、核苷酸多态性特征
- 群体遗传学研究: 分析高连锁不平衡群体(因奠基者效应和瓶颈效应)中选择扫描的应用局限
- 犬类表型相关基因定位: 围绕12个已知表型相关位点,验证选择信号与表型的关联