数据集概述
本数据集为Gadwall鸭(Anas strepera)群体遗传学研究数据,包含22个核内含子序列(来自至少19条不同染色体)及相关分析文件。研究通过中性溯祖模型验证非编码基因座遗传多样性的异质性,发现其无法用简单群体历史模型解释,提示选择或种间杂交可能是原因。数据集共27个文件,涵盖序列、分析代码及文档。
文件详解
- 基因序列文件(.fas格式,共22个)
- 示例文件:GH1.fas、LCAT.fas、NCL.fas、SOX9.fas等
- 内容:Gadwall鸭22个核内含子的核苷酸序列数据,用于遗传多样性分析
- 文本说明文件(.txt格式,共2个)
- README_for_ms.out.v4.2.txt:ms模拟输出数据的处理说明文档
- infile-IMgcFiltered.txt:过滤后的IMgc输入文件,包含OW与NW Gadwall群体22个非编码基因座的遗传数据
- 文档文件(.docx格式,1个)
- Locus characteristics.docx:基因座特征描述文档,记录22个内含子基因座的基本信息
- R代码文件(.r格式,1个)
- ms.out.v4.2.R:用于处理ms模拟输出数据的R脚本,支持群体历史模型的统计分析
- XML配置文件(.xml格式,1个)
- 8taxa-22loci-RelaxClock.xml:松弛时钟模型的XML配置文件,用于多物种溯祖分析的参数设置
数据来源
Dryad数据仓库(doi:10.5061/dryad.nv5v1v59)及论文“Heterogeneity in genetic diversity among non-coding loci fails to fit neutral coalescent models of population history”
适用场景
- 群体遗传学研究:分析Gadwall鸭非编码基因座的核苷酸多样性异质性,探究遗传多样性差异的驱动因素
- 溯祖模型验证:检验中性进化假设下的群体历史模型(如分歧、基因流、种群大小变化)与实际数据的拟合度
- 进化生物学分析:通过遗传数据推断Gadwall鸭的种群历史,评估选择压力或种间杂交对遗传多样性的影响
- 生物信息学方法开发:基于22个内含子序列的基因组样带数据,优化群体遗传数据分析的计算流程