数据集概述
本数据集基于中非加蓬野生山魈种群的非侵入性粪便样本,通过下一代测序技术获取其主要组织相容性复合体(MHC)基因数据。包含45个新发现的II类MHC DRB等位基因(含DRB9假基因),补充了圈养种群研究的局限性,为山魈免疫遗传多样性及保护策略制定提供数据支持。
文件详解
- 文档类文件
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:说明研究目的、测序方法(Illumina测序)、样本类型(粪便与组织样本对比)及等位基因分配方法(degree of change法)
- 序列数据文件
- 文件名称:all_identified_alleles.fas
- 文件格式:FAS
- 字段映射介绍:包含山魈MHC DRB基因的所有已识别等位基因序列
- 频率统计文件
- 文件名称:2018_seqfreqs.csv、2021_seqfreqs.csv
- 文件格式:CSV
- 字段映射介绍:记录不同年份样本的等位基因频率数据,包含sampleID(样本ID)、allele(等位基因)、frequency(频率)、replication(重复验证标记)、rank(频率排名)等字段
- 共识等位基因文件
- 文件名称:consensus_alleles.csv
- 文件格式:CSV
- 字段映射介绍:汇总共识等位基因信息,包含SEQUENCE(序列)、LENGTH(长度)、SAMPLES(样本数)、Clade(进化支)、ST(序列类型)、DEPTH_AMPLICON(扩增子深度)及多个样本ID对应的检测情况
- 压缩包文件
- 文件名称:consensus_fasta_files.zip、DOC_assignments_per_run.zip
- 文件格式:ZIP
- 字段映射介绍:分别存储共识等位基因的FASTA文件包、各测序批次的等位基因分配结果文件包
数据来源
论文“What mandrills leave behind: using fecal samples to characterize the major histocompatibility complex in a threatened primate”
适用场景
- 灵长类免疫遗传学研究:分析山魈MHC基因多样性、新等位基因功能及与疾病抗性的关联
- 濒危物种保护规划:基于MHC基因多样性评估野生山魈种群健康状况,指导保护策略制定
- 非侵入性测序方法优化:对比粪便与组织样本的测序重复性差异,改进野生动物基因研究技术
- 进化生物学分析:探究山魈MHC基因与其他灵长类的共享谱系及演化规律