数据集概述
本数据集是论文《Latent infection of an active giant endogenous virus in a unicellular green alga》的补充数据,包含7个文件,涉及单细胞绿藻中巨型内源性病毒潜伏感染相关的基因组序列、蛋白质序列、模型文件及重复序列信息,支持病毒基因结构、蛋白质模型及序列特征的研究。
文件详解
- 文件名称:File_description.txt,格式:TXT,内容:数据集文件说明文档
- 文件名称:GEVE_506_model.pdb,格式:PDB,内容:病毒相关蛋白质的三维结构模型文件
- 文件名称:9kb_repeat.txt,格式:TXT,内容:包含TE3-2_cRei#Unknown等序列的9kb重复序列数据
- 文件名称:GEVE_genes.fna,格式:FNA,内容:巨型内源性病毒(GEVE)的基因核苷酸序列文件
- 文件名称:GEVE_contigs.fasta,格式:FASTA,内容:巨型内源性病毒的基因组 contig 序列文件
- 文件名称:GEVE_proteins.faa,格式:FAA,内容:巨型内源性病毒的蛋白质氨基酸序列文件
- 文件名称:Alignments.zip,格式:ZIP,内容:序列比对结果的压缩包文件
数据来源
论文《Latent infection of an active giant endogenous virus in a unicellular green alga》
适用场景
- 病毒基因组结构分析: 利用GEVE_contigs.fasta和GEVE_genes.fna研究巨型内源性病毒的基因组成与结构特征
- 病毒蛋白质结构研究: 通过GEVE_506_model.pdb分析病毒蛋白质的三维结构及功能位点
- 重复序列特征分析: 基于9kb_repeat.txt探究病毒基因组中的重复序列类型及分布规律
- 病毒潜伏感染机制研究: 结合基因、蛋白质及序列比对数据,解析单细胞绿藻中巨型内源性病毒的潜伏感染分子机制
- 生物信息学序列比对: 利用Alignments.zip中的比对结果开展病毒序列进化与同源性分析