数据集概述
本数据集包含丙型肝炎病毒(HCV)基因型1和2重组基因组相关数据,聚焦2k/1b循环重组形式(CRF)的遗传结构与系统地理历史。整合了19个国家109条序列的全编码区比对、重组断点分析结果及贝叶斯系统地理推断文件,揭示其单系起源、重组断点位置及以俄罗斯为祖先来源的传播路径,共含32个文件。
文件详解
- 序列比对文件(FASTA格式)
- 代表文件:2k1b_109_fullCodingRegion.fasta、2b1a_1a_ext.fasta、2k1b_1b_ext.fasta
- 字段/内容:包含HCV不同基因型(1a、1b、2k、2b)的基因组片段或全编码区核苷酸序列,用于遗传变异与重组分析
- 系统发育树文件(TRE/TREE格式)
- 代表文件:2k1b_2k_ext_IQTree_midpoint.tre、2k1b_denseGenome_4GTR4clocks_COO_BSSVSMJ.MCC.tree
- 内容:基于不同模型构建的系统发育树,含分支结构、节点支持度及地理来源标注,反映病毒进化关系与传播历史
- 贝叶斯分析配置文件(XML格式)
- 代表文件:2k1b_FullGenome_9GTR1clock.xml、Skyride_denselySampled_4GTR4clocks.xml
- 内容:贝叶斯系统地理分析的参数配置,包括替代模型(GTR)、分子钟模型、地理扩散模型(BSSVS)等设置
- 地理扩散分析结果文件(XML格式)
- 代表文件:2k1b_fullGenome_9GTR1clock_COO_BSSVS_MarkovJumps.xml
- 内容:记录病毒在不同地理区域间的扩散事件、频率及时间节点,支持传播路径推断
数据来源
论文“Hepatitis C virus genotype 1 and 2 recombinant genomes and the phylogeographic history of the 2k/1b lineage”
适用场景
- HCV重组病毒遗传结构研究:利用FASTA序列分析2k/1b等重组谱系的基因组特征与重组断点位置
- 病毒系统发育与进化分析:通过系统发育树文件探究HCV重组株的单系起源及进化速率
- 病毒地理传播历史推断:基于贝叶斯分析结果研究2k/1b谱系的祖先来源及跨国传播路径
- 地缘政治与病毒扩散关联分析:结合传播数据探讨地缘因素对CRF 2k/1b历史传播的影响机制
- 病毒分子流行病学研究:整合多国家序列数据,分析2k/1b谱系的全球流行分布与扩散动态