数据集概述
本数据集包含德国境内SARS-CoV-2病毒的基因组序列及相关元数据,旨在支持病毒传播路径追踪、变异监测及耐药性预测等研究。数据覆盖2023年5月31日前通过DESH提交至RKI的序列,以及后续IMSSC2实验室网络和Charité冠状病毒参考中心提供的样本,确保对病毒种群的代表性观察。
文件详解
- 序列数据文件:
- SARS-CoV-2-Sequenzdaten_Deutschland.tsv.xz:TSV压缩文件,包含病毒基因组序列的结构化元数据
- SARS-CoV-2-Sequenzdaten_Deutschland.fasta.xz:FASTA压缩文件,存储病毒基因组序列数据
- 变异信息文件:
- SARS-CoV-2-Entwicklungslinien_zu_Varianten.tsv:TSV文件,字段包括LINEAGE(谱系)、WHO_LABEL(WHO命名)、CONTRIBUTING_LINEAGES(贡献谱系)、COLOR(颜色标记)、variant_category(变异类别)
- SARS-CoV-2-Entwicklungslinien_berichtet.tsv:TSV文件,字段包括LINEAGE(谱系)、WHO_LABEL(WHO命名)、CONTRIBUTING_LINEAGES(贡献谱系)
- 元数据及文档:
- Metadaten.zip:压缩文件,包含数据集元数据
- datapackage.json:JSON文件,包含数据集名称、标题、描述等基本信息
- [Dokumentation]_SARS-CoV-2-Sequenzdaten_aus_Deutschland.pdf:PDF文档,提供数据集使用说明
数据来源
德国罗伯特·科赫研究所(RKI)、IMSSC2实验室网络、Charité冠状病毒参考中心(NRZ Coronaviren)
适用场景
- 病毒变异监测:分析德国境内SARS-CoV-2变异株的分布及演化趋势
- 传播路径研究:通过基因组数据重建病毒传播链,追踪感染源
- 耐药性预测:基于病毒基因序列突变分析,预测潜在的药物耐药性
- 公共卫生决策:为疫情防控策略制定提供病毒流行特征的数据支持
- 国际合作研究:支持全球范围内的病毒基因组比较分析及变异预警