数据集概述
该数据集包含经MAPLE0.6.11处理的全球200万条SARS-CoV-2基因组数据,源自Viridian平台。涵盖基因组比对、变异信息、进化树及元数据等多类型文件,为新冠病毒基因组研究提供基础数据支持。
文件详解
- 元数据文件:
- Viridian_2M_noShortDel_deeper_SPRTA0611_metaData_combined.tsv.zip:ZIP格式压缩包,包含SARS-CoV-2基因组相关元数据,存储格式为TSV
- Viridian_2M_noShortDel_deeper_SPRTA0611_metaData_combined.tsv.gz:GZIP格式压缩包,内容同上述元数据文件
- 基因组比对文件:
- Viridian_2M_SARS-COV-2_alignment.maple.zip:ZIP格式压缩包,包含SARS-CoV-2基因组比对数据
- 变异信息文件:
- Viridian_noShortDel_deeper_SPRTA0611_subs.txt:TXT格式文件,包含数值型变异相关数据,预览内容为多组浮点数值
- 进化树文件:
- Viridian_2M_noShortDel_deeper_SPRTA0611_tree.tree.zip:ZIP格式压缩包,存储SARS-CoV-2基因组进化树数据
- Viridian_2M_noShortDel_deeper_SPRTA0611_tree_combined.jsonl.zip:ZIP格式压缩包,以JSONL格式存储组合进化树数据
适用场景
- 病毒进化研究:分析SARS-CoV-2基因组变异趋势与进化关系
- 流行病学分析:基于元数据探究全球新冠病毒传播特征
- 基因组学研究:开展新冠病毒基因组比对与突变位点分析
- 生物信息学应用:验证病毒进化树构建算法及基因组处理工具性能