数据集概述
本数据集包含热带雨林物种Symphonia globulifera的从头组装核基因组、叶绿体基因组及线粒体基因组相关数据,涉及基因组组装、注释、编码序列提取及基因比对结果,可用于研究该物种的种内遗传变异特性,共包含7个文件。
文件详解
- 重复屏蔽的从头基因组组装文件:Sglo_platanus2.masked.zip,格式为ZIP,为基因组组装的压缩文件
- 基因组注释文件:Sglo_augustus.hints_fix_ifs_.gtf,格式为GTF,包含基因组注释信息
- 核编码序列文件:Sglo_augustus.hints.codingseq.fa,格式为FA,为核基因组组装中的编码序列
- 核单拷贝基因比对文件:Sglo_trimalSingleCopy.nex,格式为NEX,为两个样本间核单拷贝基因的两两比对结果
- 叶绿体编码基因比对文件:Sglo_aligned_cpGenes.nex,格式为NEX,为叶绿体编码基因的比对结果
- 线粒体编码基因比对文件:Sglo_aligned_mtGenes.nex,格式为NEX,为线粒体编码基因的比对结果
- 功能注释文件:Sglobulifera_TOA_best_hits.csv,格式为CSV,含seq_id(序列ID)、nt_seq_id(核苷酸序列ID)、aa_seq_id(氨基酸序列ID)、hit_id(匹配ID)、hsp_evalue(比对期望值)、species(物种)等字段,为核基因组的功能注释结果
数据来源
欧洲核苷酸档案库(ENA)项目PRJEB62664
适用场景
- 热带植物基因组学研究:分析Symphonia globulifera的核、叶绿体及线粒体基因组结构与特性
- 种内遗传变异分析:通过单拷贝基因比对研究该物种的种内遗传差异
- 基因组功能注释研究:基于功能注释文件探究基因的功能及分类
- 细胞器基因组进化分析:利用叶绿体和线粒体编码基因比对结果研究细胞器基因组的进化规律