数据集概述
本数据集包含亚洲龙鱼(Scleropages formosus)三种常见变种(金色、红色、绿色)的基因组序列与注释数据。其中金色龙鱼为染色体水平组装,红、绿龙鱼为草图组装,分别注释了22016、21256、21524个蛋白编码基因,旨在解决其生物学研究与育种种质缺乏参考基因组的问题。
文件详解
- 文件名称:Golden_arowana_chromosomes_gene_annotation.gff
- 文件格式:GFF
- 字段映射介绍:金色亚洲龙鱼染色体水平基因组的基因注释文件,包含基因位置、结构等注释信息
- 文件名称:Three_varieties_of_arowana_gene_annotation_protein.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包文件,包含金色、红色、绿色三种亚洲龙鱼变种的蛋白编码基因注释相关数据
- 文件名称:Three_varieties_of_arowana_gene_annotation_gff.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包文件,包含金色、红色、绿色三种亚洲龙鱼变种的基因组注释GFF格式相关数据
数据来源
论文“A chromosome-level genome assembly of the Asian arowana, Scleropages formosus”
适用场景
- 亚洲龙鱼生物学基础研究: 利用染色体水平基因组组装数据,开展物种进化、基因功能等生物学机制研究
- 观赏鱼类分子育种: 基于三种变种的基因注释信息,挖掘与体色、生长等性状相关的分子标记,助力精准育种
- 基因组注释方法优化: 对比不同变种的基因注释结果,优化鱼类基因组注释流程与算法
- 物种保护遗传学研究: 利用高质量基因组数据,分析亚洲龙鱼种群遗传结构与多样性,为保护策略制定提供支撑