数据集概述
本数据集为跨物种靶向捕获技术研究的相关数据,包含针对不同物种(蛇、壁虎、安乐蜥等)设计的参考序列、捕获探针序列、组装分析流程及脚本等文件。该技术可从分化达2亿年的物种中高效恢复目标基因完整编码区,数据适用于系统发育分析、分子进化及功能研究,共包含五个文件。
文件详解
- 参考序列文件(.fas格式)
- 文件名称:Supplementary File 5 - Snake Reference.fas、Supplementary File 6 - Gekko Reference.fas、Supplementary File 4 - Anolis Reference.fas
- 文件格式:FAS
- 字段映射介绍:包含蛇、壁虎、安乐蜥等不同物种的基因参考序列,为靶向捕获探针设计及后续序列比对提供基础模板
- 探针设计与序列文件(.zip格式)
- 文件名称:Supplementary File 2 - Probe Design and Sequences.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含针对多参考物种设计的靶向捕获探针序列及相关设计文档,探针经广泛平铺以支持跨物种捕获
- 组装与分析流程脚本文件(.zip格式)
- 文件名称:Supplementary File 3 - Assembly and Analysis Pipelines and Scripts.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含用于处理捕获数据的生物信息学分析流程及脚本,可实现目标基因的恢复、组装及完整性评估
适用场景
- 跨物种靶向捕获技术优化: 分析探针多样性、平铺策略对不同分化程度物种基因捕获效率及完整性的影响
- 分子系统发育研究: 利用捕获的完整编码区序列构建准确的物种进化树
- 分子进化机制分析: 基于跨物种编码区序列比较,研究基因序列的进化模式与选择压力
- 比较基因组学研究: 为大尺度跨物种基因功能比较及进化保守性分析提供数据支持
- 生物信息学流程开发: 参考组装与分析脚本,优化跨物种捕获数据的生物信息学处理方法