数据集概述
本数据集包含同源导入小鼠线粒体DNA谱分析项目中所有使用和生成的处理数据文件,涵盖变异数据、频率统计、深度数据等关键分析结果,通过配套PDF文档提供文件和字段说明,为线粒体DNA变异与功能研究提供结构化数据支持。
文件详解
- 核心分析文件(包含于压缩包中):
- somatic_mutations.vcf:VCF格式,体细胞变异数据文件
- haplotype_mutations.vcf:VCF格式,单倍型变异数据文件
- supertable.txt:TXT格式,综合数据表
- cleaned_read_depth_per_pos.txt:TXT格式,每个位点的清洁读取深度数据
- adjusted_mut_freq_for_haplotypes.csv:CSV格式,单倍型调整后的突变频率数据
- mut_freq_per_type.csv:CSV格式,按类型分类的突变频率数据
- 文档与压缩包文件:
- serrano2023_directory_of_files.pdf:PDF格式,数据集文件及字段说明文档
- selection_analysis.zip:ZIP格式,选择分析相关文件压缩包
- reversion analysis.zip:ZIP格式,回复突变分析相关文件压缩包
- fasta_files.zip:ZIP格式,FASTA序列文件压缩包
- raw_data.zip:ZIP格式,原始数据压缩包
- change_in_mutfreq_w_age.zip:ZIP格式,随年龄变化的突变频率数据压缩包
- input_files.zip:ZIP格式,输入文件压缩包
- annotating_variants.zip:ZIP格式,变异注释相关文件压缩包
适用场景
- 线粒体遗传学研究:分析同源导入小鼠线粒体DNA的变异特征与遗传规律
- 突变频率分析:探究不同单倍型线粒体DNA的突变频率及随年龄变化趋势
- 生物信息学方法验证:作为线粒体DNA谱分析流程的测试数据集
- 分子进化研究:研究线粒体DNA变异的选择压力与回复突变机制