数据集概述
本数据集包含加拿大不列颠哥伦比亚省3个地点种植的25个开放授粉家系的1126株白云杉的基因组选择预测数据,涉及产量和木材属性表型数据、不同缺失率下的SNP插补数据,支持林业育种中基因组选择模型的开发与验证。
文件详解
- 文件名称:Phenotypes.csv
- 文件格式:CSV
- 字段映射介绍:包含TreeID(树木ID)、site(地点)、family(家系)、tree(树木编号)、ht(树高)、dbh(胸径)、volume(材积)、Velocity(速度)、Resistograph(阻力仪数据)、Xray(X光数据)、MoE(弹性模量)等表型数据字段。
- 文件名称:SNP MI 30%.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含30%缺失数据下使用均值插补(MI)算法处理的SNP基因型数据。
- 文件名称:SNP MI 60%.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含60%缺失数据下使用均值插补(MI)算法处理的SNP基因型数据。
数据来源
论文“Prediction accuracies for growth and wood attributes of interior spruce in space using genotyping-by-sequencing”
适用场景
- 林业育种基因组选择模型优化: 用于比较不同插补算法、预测模型对云杉生长与木材属性的预测准确性。
- 树木遗传参数估计: 分析基因组信息对遗传力、遗传增益等参数估计的影响。
- 多性状联合选择研究: 利用PCA分析结果探索负相关性状的并发选择策略。
- 林业育种策略制定: 评估单地点与多地点基因组选择模型的可靠性,支持育种方案设计。