数据集概述
本数据集基于2020年5月17日从GISAID获取的超过15000条SARS-CoV-2基因组序列,研究主蛋白酶催化位点的进化与基因组变异。通过系统发育推断、突变聚类等方法识别可能受测序伪影影响的位点,发现该区域高度保守,仅存在M49I、P52S等低频氨基酸变异。数据集包含一份文档文件。
文件详解
- 文件名称:SARS-CoV-2 genetic variation at Mpro catalytic site.docx
- 文件格式:DOCX
- 字段映射介绍:文档记录了SARS-CoV-2主蛋白酶催化位点的进化分析结果,包括基因组变异位点识别、低频氨基酸变异类型(M49I、P52S、N142S、P168S)及其出现频率等核心研究数据。
数据来源
GISAID数据库(2020年5月17日获取的基因组序列)
适用场景
- 病毒进化研究: 分析SARS-CoV-2主蛋白酶催化位点的保守性及变异规律,探究病毒进化趋势。
- 抗病毒药物靶点研究: 基于催化位点的保守性特征,为抗新冠病毒药物靶点设计提供数据支持。
- 测序数据质量评估: 参考测序伪影识别方法,优化病毒基因组测序数据的质控流程。
- 病毒变异监测: 跟踪SARS-CoV-2主蛋白酶关键位点的低频变异,为疫情防控提供分子流行病学依据。