数据集概述
本数据集为日本温带五岛列岛海域珊瑚分离的涡鞭毛虫Effrenium voratum菌株(NIES-2908)的首次基因组序列研究补充材料,包含基因组组装、基因注释文件及研究相关图表和表格,为共生生物分子生物学及比较基因组学研究提供资源。
文件详解
该数据集包含以下文件,具体说明如下:
- 基因组序列与注释文件(压缩格式.gz):
- NIES2908.cds.fa.gz:编码序列文件
- NIES2908.cds.longest.fa.gz:每个基因最长编码序列文件
- NIES2908.protein.fa.gz:蛋白质序列文件
- NIES2908.protein.longest.fa.gz:每个基因最长蛋白质序列文件
- NIES2908.gtf.gz:GTF格式的基因注释文件
- 图表文件(PDF格式):
- FigS1.pdf:基因组组装和基因注释工作流程示意图
- FigS2.pdf:基因组大小估计图表
- FigS3.pdf:基于18S rRNA的分子系统发育树
- 数据表格文件(XLSX格式):
- Tables.xlsx:原始数据、基因注释用蛋白质组及基因组/基因模型统计信息表格
- 对应表文件(TXT格式):
- Contig.acclist.txt:Contig编号与GenBank登录号的对应表
适用场景
- 分子生物学研究:分析Effrenium voratum菌株的基因结构与功能
- 比较基因组学研究:探究温带地区涡鞭毛虫的局部适应性机制
- 共生生物学研究:作为非共生涡鞭毛虫对照,研究共生关系分子基础
- 进化生物学研究:通过18S rRNA系统发育树分析物种进化关系
- 基因组学方法学研究:参考基因组组装与注释的工作流程设计