数据集概述
本数据集为论文《Unnatural evolutionary processes of SARS-CoV-2 variants and possibility of deliberate natural selection》的压缩原始数据,包含745个文件,涉及SARS-CoV-2病毒分离株的序列与文档类数据,用于支持关于病毒变异体进化过程的研究分析。
文件详解
- 主要文件类型及内容:
- .seq格式文件:共374个,占比约50.2%,为SARS-CoV-2病毒分离株的序列数据,命名包含地区、年份等信息(如SARS-CoV-2_human_USA_FL-CDC-FG-029674_2021.seq)
- .docx格式文件:共369个,占比约49.53%,为相关文档类数据,命名规则与seq文件一致(如SARS-CoV-2_human_USA_NJ-CDC-LC0479598_2022.docx)
- .zip格式文件:1个,为数据集的压缩包文件
- .dna格式文件:1个,为SARS-CoV2武汉株比对数据(SARS-CoV2_Wuhan align 230304.dna)
数据来源
Zenodo平台(DOI: 10.5281/zenodo.8248320)
适用场景
- 病毒进化研究:分析SARS-CoV-2变异体的非自然进化过程及相关机制
- 病毒基因组学分析:基于seq与dna文件开展病毒基因组序列比对、突变位点识别等研究
- 病毒变异体溯源:结合地区、年份等命名信息,探究不同变异体的时空分布特征
- 医学文献辅助研究:为病毒进化相关论文提供原始数据支撑与验证材料