数据集概述
本数据集为Barclay Powell博士论文第二章所使用的形态学补充数据,主要用于遗传学分析。数据包含全基因组关联分析(GWAS)相关的基因型文件和主成分分析(PCA)结果,涵盖单核苷酸多态性(SNP)数据、主成分载荷文件以及分析结果可视化图表。数据集共包含六个文件,涉及五种不同的文件格式。
文件详解
- 基因型数据文件(PLINK格式)
- 文件名称:
CleanMeasuresSNPsJune2025.fam、CleanMeasuresSNPsJune2025.bed、CleanMeasuresSNPsJune2025.bim
- 文件格式: FAM、BED、BIM
- 字段映射介绍: 此为标准的PLINK二进制格式基因型数据,其中FAM文件包含样本家族信息,BED文件存储基因型矩阵,BIM文件记录SNP标记信息(如染色体、位置、等位基因)。
- 主成分分析载荷文件
- 文件名称:
PC1Chr7markers.txt.ld、PC1Chr1markers.txt.ld
- 文件格式: LD (文本格式)
- 字段映射介绍: 可能包含染色体1和7上SNP标记与第一主成分(PC1)的连锁不平衡(LD)或载荷系数信息。
- 可视化图表文件
- 文件名称:
Figure Scree plot PC analysis Body measures.png
- 文件格式: PNG
- 字段映射介绍: 为主成分分析的碎石图(Scree Plot)可视化结果,用于展示各主成分解释的方差比例。
数据来源
Barclay Powell博士论文
适用场景
- 遗传学与形态学关联研究: 利用GWAS数据探索形态学性状(如身体测量指标)与遗传标记(SNP)之间的关联性。
- 群体遗传结构分析: 通过主成分分析(PCA)研究样本群体的遗传结构或分层情况。
- 生物信息学方法验证: 作为PLINK等标准遗传分析工具链的输入数据,用于方法学验证或教学示例。
- 学术研究与可重复性: 为相关领域研究者提供论文结果的原始数据支持,促进科学研究的可重复性与深入分析。