数据集概述
本数据集围绕大型双链DNA病毒基因组结构变异展开研究,通过短读长(Illumina)和长读长(PacBio)测序技术分析AcMNPV病毒基因组,识别出1141个结构变异(SVs)及1757个转座元件插入,并扩展验证了虹彩病毒和疱疹病毒的SV特征,揭示了SV在病毒种群中的动态演化规律。
文件详解
- 基因组序列与注释文件
- 文件名称:AcMNPV_genome.csv、IIV31_genome.csv、HCMV_genome.csv、IIV6_genome.csv
- 文件格式:CSV
- 字段映射介绍:包含Gene Name(基因名称)、Product(产物)、Function(功能)、Start/Stop(起始/终止位置)、Size(长度)、Genetype(基因类型)等病毒基因组注释信息
- 文件名称:AcMNPV_genome.fas、IIV31_genome.fas、HCMV_genome.fas、IIV6_genome.fas
- 文件格式:FAS
- 字段映射介绍:病毒基因组序列文件
- 补充表格文件
- 文件名称:Supplementary_Table_S1.xlsx、Suppplementary_Table_S2.docx、Supplementary_Table_S3.docx、Suppplementary_Table_S4.xlsx、Suppplementary_Table_S5.xlsx、Suppplementary_Table_S6.xlsx
- 文件格式:XLSX、DOCX
- 字段映射介绍:研究相关的补充表格数据,包含结构变异统计、转座元件分析等结果
- 分析脚本文件
- 文件名称:SV_detection_script_in_short_and_long_reads.R
- 文件格式:R
- 字段映射介绍:用于检测短读长和长读长数据中结构变异的分析脚本
- 补充图表文件
- 文件名称:Supplementary_Figures_09_09.docx
- 文件格式:DOCX
- 字段映射介绍:研究相关的补充图表资料
数据来源
论文“Wide spectrum and high frequency of genomic structural variation, including transposable elements, in large double stranded DNA viruses”
适用场景
- 病毒基因组演化研究:分析结构变异在病毒种群中的分布频率与动态变化规律
- 转座元件功能研究:探究转座元件在病毒基因组中的插入特征及水平转移机制
- 病毒分子生物学分析:通过基因组注释数据研究病毒基因功能与结构关联
- 病毒种群遗传学研究:验证不同类型双链DNA病毒(杆状病毒、虹彩病毒、疱疹病毒)的结构变异共性特征
- 基因组变异检测方法优化:基于短读长与长读长联合分析的结构变异检测流程应用与改进