数据集概述
本数据集包含Penium margaritaceum(PmNIES217)的转录组从头组装结果及相关注释元数据,由4个文件组成。数据涵盖转录组序列、蛋白组序列、功能注释表格等内容,支持对该藻类基因功能、蛋白结构及代谢通路的研究。
文件详解
- TrinityTranscriptome.okay.fasta
- 文件格式:FASTA
- 字段映射介绍:基于Illumina原始reads通过Trinity组装得到的Penium margaritaceum(PmNIES217)转录组序列文件,包含转录本核苷酸序列信息。
- Penium annotation merged.xls
- 文件格式:XLS
- 字段映射介绍:包含完整转录组通过BUSCO(viridiplantae_odb10数据库)评估的注释信息列表。
- PeniumDenovoV3.cdhit99.fa
- 文件格式:FA
- 字段映射介绍:通过TransDecoder将转录组序列转换得到的蛋白组序列文件,经过CD-HIT以99%相似性聚类去冗余。
- Penium annotation merged.tsv
- 文件格式:TSV
- 字段映射介绍:包含多源注释信息的表格,字段包括GeneID、IsoformID、ProteinID、IPRid(InterPro结构域ID)、IPRname(结构域名称)、Eggnog_Desc(EggNOG功能描述)、GO terms(基因本体术语)、TAIRid(拟南芥同源基因ID)、MARPO(地钱同源基因信息)等,整合了InterProScan、EggNOG mapper、BLASTP(拟南芥、地钱)的注释结果。
适用场景
- 藻类功能基因组学研究:通过转录组序列和注释信息分析Penium margaritaceum的基因功能、表达模式及代谢通路。
- 蛋白组学分析:利用蛋白组序列文件研究该藻类的蛋白结构、结构域组成及进化关系。
- 比较基因组学研究:基于拟南芥、地钱的同源基因注释,探究Penium margaritaceum与其他植物的进化关联。
- 生物信息学方法验证:用于评估转录组组装、蛋白预测及功能注释流程的准确性与完整性。