数据集概述
本数据集记录基于RNA探针的哺乳动物线粒体基因组溶液内富集实验结果,包含7个目哺乳动物探针集的设计与测试数据,涉及5个目22属共63个线粒体基因组的覆盖度、回收率等关键指标,以及探针捕获能力的聚类分析结果,为退化DNA的线粒体基因组富集研究提供支撑。
文件详解
- 序列文件
- 文件名称:pero_in.454.fasta.qual、AllProbes_good.fasta
- 文件格式:FASTA.QUAL、FASTA
- 字段映射介绍:包含探针序列及相关质量信息,其中AllProbes_good.fasta为设计的哺乳动物线粒体富集探针序列集
- 测序数据文件
- 文件名称:H3HWW5Q01.sff、H3FTPWM01.sff
- 文件格式:SFF
- 字段映射介绍:高通量测序原始数据文件,记录测序 reads 的序列、质量值等信息
- 代码文件
- 文件名称:combiner-2.0.py、sequenceGetter-4.0.py、chimera_ID.py
- 文件格式:PY
- 字段映射介绍:实验分析所用的脚本文件,分别用于数据合并、序列提取及嵌合分子识别
- 文本数据文件
- 文件名称:Dryad_ModernSquirrelDemux.txt、WMG_Alignment26Ind_FINAL01.09.14.txt
- 文件格式:TXT
- 字段映射介绍:Dryad_ModernSquirrelDemux.txt记录454测序数据的分样信息(含Run ID、物种、样本编号、 barcode 序列等);WMG_Alignment26Ind_FINAL01.09.14.txt为26个个体线粒体基因组比对结果数据
- 压缩文件
- 文件名称:Enrichment Assemblies.zip
- 文件格式:ZIP
- 字段映射介绍:线粒体基因组富集组装结果的压缩包,包含富集后的序列组装数据
数据来源
论文“In-solution hybridization for mammalian mitogenome enrichment: pros, cons and challenges associated with multiplexing degraded DNA”
适用场景
- 分子生物学探针设计研究:分析不同哺乳动物目探针的设计策略及有效性,优化线粒体基因组富集探针集
- 退化DNA线粒体基因组富集分析:评估探针在退化DNA样本中的线粒体基因组覆盖度、回收率等指标,探索退化样本的线粒体基因组获取方法
- 高通量测序数据处理:利用代码文件学习测序数据的合并、序列提取及嵌合分子识别等生物信息学分析流程
- 哺乳动物线粒体基因组进化研究:基于线粒体基因组覆盖度、序列分歧度等数据,分析哺乳动物线粒体基因组的进化特征
- 古DNA研究支撑:为古生物或考古样本中退化DNA的线粒体基因组富集提供技术参考与数据支撑