Npumilio_Based_巴塔哥尼亚树木局部适应性候选基因与变异数据

数据集概述

本数据集围绕巴塔哥尼亚建群树种Nothofagus pumilio的局部适应性研究,包含6个核心文件,涵盖特定候选基因列表、探针设计信息、SNP变异数据、样本元数据及直系同源群数据。数据支持该树种适应性相关基因的注释、变异分析及样本地理信息关联,为树木遗传学研究提供基础数据。

文件详解

  • Npumilio_specific_candidate_genes.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含1,789个候选基因的contig、Uniprot-TAIR编号及原始物种信息,记录基因纳入候选列表的原因(如热胁迫转录组研究中上调/下调、木材生长相关等),保留重复contig以展示原因信息。
  • N_pumilio_06Nov2019_probe_coverage.txt
  • 文件格式:TXT
  • 字段映射介绍:包含REGION_NAME、CHROMOSOME、START、STOP、LENGTH、BASES_PROBE_COVERAGE、FRAC_PROBE_COVERAGE、BASES_ESTIMATED_COVERAGE、FRAC_ESTIMATED_COVERAGE等探针覆盖度相关字段。
  • variants-gatk_haplotypecaller_SNP_raw.vcf.gz
  • 文件格式:VCF.GZ
  • 字段映射介绍:原始SNP变异数据,包含502个样本(496株成年树+6个重复)的所有called SNP变异。
  • variants-gatk_haplotypecaller_SNP.vcf.gz
  • 文件格式:VCF.GZ
  • 字段映射介绍:经过粗质量过滤的SNP变异数据,为下游分析的起始数据集。
  • Npumilio_IDs_vcforder_all_info.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:与VCF文件样本顺序一致的元数据,包含样本的位点名称、地理坐标及海拔信息。
  • Npumilio_orthogroups.csv
  • 文件格式:CSV
  • 字段映射介绍:包含Orthogroup(直系同源群)、Athaliana(拟南芥TAIR编号)、Nothofagus(Nothofagus最佳匹配contig)字段,用于与直系同源群候选基因集交叉参考。

数据来源

论文“Local adaptation in the Patagonian foundation tree species Nothofagus pumilio”

适用场景

  • 树木局部适应性基因分析:通过候选基因列表研究Nothofagus pumilio适应性相关基因的功能与注释。
  • SNP变异分析:利用原始及过滤后的SNP数据开展群体遗传学研究,分析种群结构与遗传多样性。
  • 样本地理信息关联:结合样本元数据中的地理坐标、海拔,探究遗传变异与环境因子的相关性。
  • 直系同源基因功能注释:通过直系同源群数据交叉参考拟南芥基因信息,推测Nothofagus基因功能。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 902.83 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。