数据集概述
本数据集聚焦黄松(Pinus ponderosa)的遗传变异与环境适应性研究,通过基因型-环境关联(GEA)和基因型-表型关联(GPA)分析,识别与干旱耐受相关的遗传变异。包含223个加利福尼亚内华达山脉个体的遗传数据,筛选后保留92万余SNPs进行关联分析,涉及气候变量、温室耐旱性状等关联结果及基因注释信息。
文件详解
- 数据文件
- 文件名称:
GPA_control_796SNPs_annotation.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含与对照组表型值关联的796个SNPs的基因注释信息
- 文件名称:
GPA_droughtresponsiveness_1149SNPs_annotation.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含与干旱响应表型关联的1149个SNPs的基因注释信息
- 文件名称:
GEA_1374SNPs_annotation.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含与气候变量关联的1374个SNPs的基因注释信息
- 文档文件
- 文件名称:
README.md
- 文件格式:MD
- 字段映射介绍:数据集说明文档,包含各文件的基本描述与数据结构信息
- 归档文件
- 文件名称:
ponderosa_pine_SNPs_delintergenic_4.1million.vcf.gz
- 文件格式:VCF.GZ
- 字段映射介绍:过滤掉基因间区域后的黄松遗传数据,包含223个基因型的410万SNPs的变异位点信息
数据来源
论文“Identifying genetic variation associated with environmental variation and drought-tolerance phenotypes in ponderosa pine”
适用场景
- 植物遗传适应性研究: 分析黄松对干旱环境的遗传适应机制,识别关键耐旱相关基因
- 基因型-环境关联分析: 研究SNPs与气候变量(如4月1日积雪量)的关联模式
- 基因型-表型关联分析: 探索SNPs与温室条件下耐旱性状(对照组及干旱响应)的关联
- 植物基因功能注释研究: 基于关联SNPs的基因注释信息,分析细胞 wall 形成、胁迫响应等相关基因功能
- 气候变化适应性评估: 为黄松应对气候变化的遗传育种策略提供数据支持