数据集概述
本数据集包含五种头索动物(Asymmetron lucayanum、Branchiostoma belcheri、Branchiostoma floridae、Branchiostoma japonicum、Branchiostoma lanceolatum)的基因组注释文件,涵盖蛋白质编码基因、tRNA、rRNA及转座元件(TE)注释,还包含多阶段RNA-seq映射后的基因表达TPM数据,总计31个文件。
文件详解
- 物种基因组注释文件(共5个物种,每个物种含5类.gz文件)
- 文件名称:遵循
Species_name.[类型].gz模式(如Branchiostoma_lanceolatum.gff3.gz)
- 文件格式:GFF3、GFF2、FASTA(均为.gz压缩)
- 字段映射介绍:
Species_name.gff3.gz:蛋白质编码基因与tRNA基因注释(GFF3格式)
Species_name.cds-transcripts.fa.gz:蛋白质编码基因的CDS/转录本序列(FASTA格式)
Species_name.proteins.fa.gz:蛋白质编码基因的蛋白质序列(FASTA格式)
Species_name.rRNA.gff2.gz:rRNA基因注释(GFF2格式)
Species_name.TEanno.gff3.gz:转座元件注释(GFF3格式)
- 基因表达数据文件
- 文件名称:
cephalochordate_TPM.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含五种头索动物多阶段RNA-seq数据映射后的基因表达TPM值
数据来源
evomicslab团队(www.evomicslab.org)及相关合作研究(如Huang et al. 2023、Brasó-Vives et al. 2022等)
适用场景
- 头索动物基因组进化研究:分析五种头索动物的基因结构、转座元件分布及染色体进化规律
- 基因功能注释:利用蛋白质序列、CDS序列注释头索动物基因的功能与结构域
- 基因表达分析:基于TPM数据研究头索动物不同发育阶段的基因表达模式
- 比较基因组学:对比五种头索动物的基因组注释差异,探究头索动物与脊椎动物的进化关系
- 分子生物学实验设计:为头索动物相关基因克隆、表达验证提供序列参考