全球200万SARS_CoV_2基因组数据集_Viridian_Maple0_6_11处理

数据集概述

该数据集包含经MAPLE0.6.11处理的全球200万条SARS-CoV-2基因组数据,源自Viridian平台。涵盖基因组比对、变异信息、进化树及元数据等多类型文件,为新冠病毒基因组研究提供基础数据支持。

文件详解

  • 元数据文件:
  • Viridian_2M_noShortDel_deeper_SPRTA0611_metaData_combined.tsv.zip:ZIP格式压缩包,包含SARS-CoV-2基因组相关元数据,存储格式为TSV
  • Viridian_2M_noShortDel_deeper_SPRTA0611_metaData_combined.tsv.gz:GZIP格式压缩包,内容同上述元数据文件
  • 基因组比对文件:
  • Viridian_2M_SARS-COV-2_alignment.maple.zip:ZIP格式压缩包,包含SARS-CoV-2基因组比对数据
  • 变异信息文件:
  • Viridian_noShortDel_deeper_SPRTA0611_subs.txt:TXT格式文件,包含数值型变异相关数据,预览内容为多组浮点数值
  • 进化树文件:
  • Viridian_2M_noShortDel_deeper_SPRTA0611_tree.tree.zip:ZIP格式压缩包,存储SARS-CoV-2基因组进化树数据
  • Viridian_2M_noShortDel_deeper_SPRTA0611_tree_combined.jsonl.zip:ZIP格式压缩包,以JSONL格式存储组合进化树数据

适用场景

  • 病毒进化研究:分析SARS-CoV-2基因组变异趋势与进化关系
  • 流行病学分析:基于元数据探究全球新冠病毒传播特征
  • 基因组学研究:开展新冠病毒基因组比对与突变位点分析
  • 生物信息学应用:验证病毒进化树构建算法及基因组处理工具性能
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 396.75 MiB
最后更新 2025年12月24日
创建于 2025年12月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。