数据集概述
本数据集基于双阶段重要性抽样方法,用于从分子序列数据推断传染病病原体的传播路径。包含肺炎链球菌在难民营家庭间传播的分析数据,涵盖血清型简约SNP树及样本标签信息,支持传播动力学和地理邻近性分析,共2个文件。
文件详解
- README文档
- 文件名称:README_for_data from Two phase importance sampling for inference about transmission trees.txt
- 文件格式:TXT
- 字段映射介绍:说明数据包含NT、23F、23AF、19F、15BC、14、6B血清型的简约SNP树(.tre格式);样本标签格式示例为6899_5#16_ST315_ARI-0583_INFANT_02-Nov-09,包含基因型序列标签、MLST基因型、家庭标签、母婴标识及采样日期。
- 压缩数据文件
- 文件名称:data from Two phase importance sampling for inference about transmission trees.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包包含上述血清型的SNP树文件,支持传播树推断的相关分析。
数据来源
论文“Two-phase importance sampling for inference about transmission trees”
适用场景
- 传染病传播路径推断: 利用双阶段重要性抽样方法,从分子序列数据中重建病原体传播树。
- 肺炎链球菌传播动力学研究: 分析难民营中肺炎链球菌在家庭间的传播模式及血清型分布特征。
- 传播风险地理分析: 结合样本家庭标签,探究传播可能性与地理邻近性的关联。
- 分子流行病学统计方法验证: 验证双阶段重要性抽样在处理高维缺失数据时的推断效果。