数据集概述
本数据集围绕软蛤Mesodesma donacium的表达序列标签(EST)数据展开,通过454焦磷酸测序生成180159条EST,经从头组装得到10178个contigs和41765个singletons,最终发现2594个SNP位点,涉及613条共识序列,还包含基因本体(GO)分析及SNP验证相关信息,为该物种遗传研究提供基础数据。
文件详解
- ContigSNP_annotated_Md (613 seq).fa
- 文件格式:FA
- 字段映射介绍:包含与613条共识序列相关的SNP注释的contig序列信息
- Multi BLAST (613 sequences)_MmSNP.xlsx
- 文件格式:XLSX
- 字段映射介绍:613条含SNP序列的多序列比对(BLAST)结果数据
- Md.fa
- 文件格式:FA
- 字段映射介绍:Mesodesma donacium的序列数据文件
- GOAnalysis MmSNPs.xlsx
- 文件格式:XLSX
- 字段映射介绍:含SNP序列的基因本体(GO)分析结果数据
数据来源
论文“SNP discovery and gene annotation in the surf clam Mesodesma donacium”
适用场景
- 海洋软体动物遗传多样性研究: 利用SNP位点信息分析Mesodesma donacium的遗传多态性水平与种群结构
- 功能基因注释与分析: 通过GO分析结果探究含SNP序列对应的分子功能与生物学过程
- 遗传标记开发: 基于发现的SNP位点开发该物种的分子遗传标记,用于种群鉴定等研究
- 关键基因功能研究: 针对热休克蛋白、翻译延伸因子等注释基因的SNP位点,研究其功能多态性及与性状的关联
- 分子进化分析: 利用EST组装及SNP数据开展该物种的分子进化与适应性进化研究