数据集概述
本数据集为杨属物种性别决定机制研究相关数据,包含86个杨属个体(52个毛果杨、34个香脂杨)的全基因组重测序结果,涉及性别关联SNP、系统发育树、序列文件及连锁不平衡数据等,用于分析杨属性别决定区域的大小、进化时间及性别决定系统类型。
文件详解
- 文档文件
- 文件名称:
README_for_Association_SNPfiles_Plink.txt、README_for_Admixture_inputfiles.txt
- 文件格式:TXT
- 字段映射介绍:说明关联SNP文件和Admixture输入文件的格式,提及Plink格式规则、毛果杨19条染色体的SNP定位方式(未定位到染色体的SNP标记为20号染色体)
- 序列文件
- 文件名称:
sanger_7690067_oneclone.fas、sanger_7690067_anno.fas、chr19.fas、sanger_7690067.fas等(共8个.fas文件)
- 文件格式:FAS
- 字段映射介绍:包含杨属物种的基因序列数据,如特定克隆序列、注释序列、19号染色体序列等
- 系统发育树文件
- 文件名称:
40024_sanger_nousat_fortree_ML.nwk、44107_sanger_tree_ML.nwk、chr19_tree_ML.nwk、sanger_7690067_ML.nwk、sanger_7690067_oneclone_ML.nwk等(共6个.nwk文件)
- 文件格式:NWK
- 字段映射介绍:存储最大似然法构建的系统发育树结构数据
- 压缩文件
- 文件名称:
PairwiseLD.zip、Association_SNPfiles_Plink.zip、Admixture_inputfiles.zip
- 文件格式:ZIP
- 字段映射介绍:分别包含成对连锁不平衡数据、关联SNP的Plink格式文件、Admixture分析输入文件
数据来源
论文“Recent Y chromosome divergence despite ancient origin of dioecy in poplars (Populus)”
适用场景
- 杨属物种性别决定机制研究:分析性别关联SNP的分布、连锁不平衡状态及性别决定系统类型
- 基因组组装准确性验证:通过性别关联SNP的染色体定位情况,评估参考基因组的组装质量
- 物种进化分析:利用系统发育树文件研究杨属物种的进化关系及性别决定区域的分化时间
- 群体遗传学研究:基于Admixture输入文件和关联SNP数据,开展群体结构分析和性别性状关联研究