数据集概述
本数据集围绕人类蛋白编码基因5'端GC含量的突变衰减研究展开,包含20个Excel文件,覆盖物种GC含量、核苷酸含量、重组相关GC含量、单碱基替换率等多维度分析内容,为生物信息学研究提供结构化数据支持。
文件详解
- 数据文件组(共20个.xlsx文件)
- 文件名称示例:Fig1_Nucleotide_content.xlsx、Fig2_GC_content_species.xlsx、Fig3_GC_content_recombination.xlsx、Fig4_TSS_all_substitutions.xlsx、Fig5_S5_DNM_data_summary.xlsx、FigS1_GC_content_ORF.xlsx、FigS2_Single_substitutions_rate.xlsx、FigS4_Mouse_recombination_all_substitutions.xlsx等
- 文件格式:XLSX
- 字段映射介绍:各文件对应研究中的不同分析维度,涵盖核苷酸含量、物种间GC含量比较、重组与GC含量关联、转录起始位点(TSS)替换分析、单碱基替换率、小鼠重组替换数据、新发突变(DNM)数据摘要等内容,具体字段需参考文件内部结构
适用场景
- 分子生物学研究:分析人类蛋白编码基因5'端GC含量的突变衰减规律
- 物种进化分析:通过物种间GC含量数据探究基因序列的进化特征
- 突变机制研究:基于单碱基替换率、重组相关替换数据解析突变发生机制
- 生物信息学统计:利用核苷酸含量、DNM数据摘要开展基因序列的统计分析
- 跨物种比较研究:结合小鼠重组数据与人类基因数据进行跨物种分子特征对比