数据集概述
本数据集包含果蝇黑腹果蝇萨塞克斯LHM样本种群遗传学研究的输入数据、代码、输出数据、汇总图表及运行日志,覆盖等位基因频率分布、连锁不平衡、遗传分组等核心分析结果,为种群遗传结构研究提供支持。
文件详解
- 输入数据文件(PLINK二进制格式):
- lhm_hc_2017.bed、lhm_hc_2017.bim、lhm_hc_2017.fam:PLINK二进制数据集文件,包含基因型数据及样本信息
- 代码文件:
- drive_popgen.sh:Unix/Linux Shell脚本,包含PLINK种群遗传分析命令,调用R脚本执行子种群文件生成和绘图
- plot_popgen.R:R脚本,用于输出数据绘图
- make_lhm_subgroups.R:R脚本,用于生成子种群文件
- install_packages_plot_popgen.R:R脚本,用于安装绘图所需R包
- 输出数据文件:
- lhm_hc_2017.frq:等位基因频率数据文件
- lhm_hc_2017.ld:连锁不平衡分析结果文件
- lhm_hc_2017.fst:遗传分化Fst分析结果文件
- lhm_hc_2017.mds:多维尺度分析结果文件
- lhm_hc_2017.genome:IBD(身份-by- descent)分析结果文件
- lhm_hc_2017.cluster1/cluster2/cluster3:遗传分组聚类结果文件
- lhm_hc_2017.prune.in/prune.out:位点筛选结果文件(保留/排除位点列表)
- lhm_subpops_plink.txt:子种群划分文件
- 图表文件:
- popgen_plots.png:种群遗传分析汇总图表
- 日志文件:
- log_sh_plot_popgen.txt、log_plot_ibd_R.txt、log_sh_make_lhm_subgroups.txt:分析过程运行日志
- 说明文件:
- READ_ME_popgen.txt:数据集说明文档,介绍分析流程及脚本用途
适用场景
- 种群遗传学研究:分析果蝇黑腹果蝇萨塞克斯LHM种群的遗传结构与分化
- 基因组学分析:探究等位基因频率分布、连锁不平衡模式及IBD遗传关系
- 生物信息学方法验证:验证PLINK与R语言在种群遗传数据分析中的应用流程
- 进化生物学研究:探讨种群遗传分组的形成机制(如历史混合事件、着丝粒区域低重组率的影响)