数据集概述
本数据集来源于向日葵种群基因组学与蛋白质进化研究,基于RNAseq技术分析野生向日葵(Helianthus spp.)的基因组变异与蛋白质进化机制。包含转录组参考序列、原始读段计数及SNP位点表格三类文件,可用于研究种群聚类、适应性替换比例、基因本体分类及蛋白质进化速率相关的基因组因素关联分析。
文件详解
- 原始读段计数文件
- 文件名称:raw_read_counts
- 文件格式:无扩展名
- 字段映射介绍:记录转录组测序的原始读段计数信息,用于基因表达水平分析
- 转录组参考序列文件
- 文件名称:TranscriptomeRef_mar30.fa
- 文件格式:FA
- 字段映射介绍:包含16,312个基因的转录组参考序列,作为SNP识别与序列比对的参考数据库
- SNP位点表格压缩包
- 文件名称:snp_table.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含433,257个多态性位点(SNPs)的表格数据,用于种群聚类分析、遗传分化(FST)及核苷酸多样性(pi)计算
数据来源
论文“The population genomics of sunflowers and genomic determinants of protein evolution revealed by RNAseq”
适用场景
- 植物种群基因组学研究:分析向日葵种群聚类结构,识别种间遗传分化与杂交个体
- 蛋白质进化机制分析:计算适应性替换比例(alpha),研究“生物刺激响应”等基因本体分类的选择压力
- 基因表达与进化关联研究:探究基因表达水平、特异性与蛋白质进化速率(dN/dS)的相关性
- 分子进化决定因素分析:关联蛋白质进化速率与遗传分化(FST)、核苷酸多样性(pi)等基因组因素
- 植物适应性进化研究:解析野生向日葵对环境选择压力的分子响应机制