数据集概述
本数据集为相关研究论文的配套数据,包含二零二三年三月至二零二四年二月美国CLIA认证实验室收集的一万五千余份匿名宫颈阴道样本数据,涵盖流行病学分析、分子检测、统计分析、机器学习建模等多环节的原始及处理数据,用于探究乳酸杆菌与HPV感染、细菌性阴道病及细胞学异常的关联。
文件详解
该数据集包含三类文件,具体说明如下:
- 栅格图片文件(.png格式,共三十八份):
- 包含研究相关的图表文件,如Fig6_ROC.png、FigS1.png、FigS3.png等,用于展示分析结果。
- 数据文件(.xlsx格式,共五份):
- Dataset 2_Association analysis.xlsx:可能包含病原体定量PCR结果及结局分类注释,含患病率和共现矩阵数据。
- Dataset 3_Cor_ANOVA_Reg_interaction effects.xlsx:可能包含细胞学和细菌性阴道病结局的编码数据,用于回归和卡方检验。
- Dataset 4_PCA_Kmeans_MachineLearning.xlsx:可能包含用于主成分分析、聚类及机器学习模型的标准化数据集。
- 文档文件(.docx格式,共一份):
- Supplemental dataset 5_interaction effects.docx:可能包含交互作用分析的输出表格,展示HPV、细菌及乳酸杆菌间的显著成对效应及q值。
适用场景
- 医学微生物学研究:分析阴道微生物组成与HPV感染、细菌性阴道病的关联及交互作用。
- 宫颈癌筛查研究:评估微生物和人口统计学特征对细胞学异常的预测价值。
- 机器学习应用:用于阴道微生物组诊断及宫颈癌筛查模型的可重复性验证与基准测试。
- 流行病学分析:探究不同患者亚群中微生物分布及与疾病结局的相关性。