数据集概述
本数据集基于ddRAD测序技术,对欧亚鲈鱼基因组进行极端复杂度简化处理,包含测序原始数据、序列比对文件、SNP引物序列及分析代码。数据覆盖17000余个contig,识别出1259个单核苷酸多态性位点,可用于研究欧亚鲈鱼淡水与咸水种群的遗传分化,为该物种基因组资源开发提供支持。
文件详解
- README_for_Alignments.txt
- 文件格式:TXT
- 字段映射介绍:说明Sanger测序比对文件的格式(BioEdit格式.bio、Fasta格式.fas)及打开工具(BioEdit v.7.2.5),包含引用文献信息
- SNP primer sequences.xlsx
- 文件格式:XLSX
- 字段映射介绍:记录识别出的1259个SNP位点对应的引物序列信息
- Alignments.rar
- 文件格式:RAR(压缩包)
- 字段映射介绍:包含BioEdit格式和Fasta格式的序列比对文件,用于查看欧亚鲈鱼基因组片段的比对结果
- PythonCodes.zip
- 文件格式:ZIP(压缩包)
- 字段映射介绍:用于处理本数据集的Python分析代码,支持基因组数据处理与SNP分析
- Raw files.rar
- 文件格式:RAR(压缩包)
- 字段映射介绍:ddRAD测序产生的原始数据文件,包含欧亚鲈鱼基因组简化后的测序片段原始信息
数据来源
论文“Less is more: extreme genome complexity reduction with ddRAD using Ion Torrent semiconductor technology”
适用场景
- 基因组复杂度简化技术研究: 分析ddRAD技术在Ion Torrent平台上的应用效果,验证极端基因组简化的可行性
- 鱼类种群遗传分化分析: 利用SNP位点数据研究欧亚鲈鱼淡水(佩普西湖)与咸水(波罗的海)种群的遗传差异
- 分子标记开发: 基于SNP引物序列,开发欧亚鲈鱼种群鉴定的分子标记工具
- 基因组数据分析方法验证: 通过Python代码复现测序数据处理流程,优化基因组简化测序的分析策略