数据集概述
该数据集为巴西西亚马逊地区SARS-COV-2基因组监测研究的生成数据,包含疫情传播进化史与遗传特征分析所需的文件,涵盖序列比对、分子钟分析及信号时间评估结果等核心内容,支持相关基因组学研究。
文件详解
数据集包含8个文件,均位于Generated data/目录下,具体说明如下:
- 样本序列与元数据文件:
- Sample_Sequences_GISAID_Metadata.zip:ZIP格式,可能包含GISAID来源的样本序列及元数据
- 数据集A相关文件:
- DATASET-A_Alignament_by_MAFFT.fas:FAS格式,通过MAFFT工具生成的数据集A序列比对文件
- Files_of_Molecular-Clock_Analysis_in_DATASET-A.zip:ZIP格式,数据集A的分子钟分析文件
- Files_of_Non-Clock_Analysis_for_Signal-Temporal_Evaluation_on_DATASET-A.zip:ZIP格式,数据集A的非钟模型信号时间评估文件
- 数据集B相关文件:
- DATASET-B_Alignament_by_MAFFT.fas:FAS格式,通过MAFFT工具生成的数据集B序列比对文件
- Files_of_Molecular-Clock_Analysis_in_DATASET-B.zip:ZIP格式,数据集B的分子钟分析文件
- Files_of_Non-Clock_Analysis_for_Signal-Temporal_Evaluation_on_DATASET-B.zip:ZIP格式,数据集B的非钟模型信号时间评估文件
- 突变分析文件:
- Alignament_for_Mutation_Analysis.fas:FAS格式,用于突变分析的序列比对文件
适用场景
- 基因组进化研究:分析巴西西亚马逊地区SARS-COV-2的传播进化历史
- 分子钟分析:探究病毒的演化速率与时间线
- 遗传特征研究:识别该地区病毒的特异性遗传标记
- 疫情传播动力学:结合基因组数据研究病毒传播模式