数据集概述
本数据集包含马达加斯加起源的果蝇Drosophila simulans M252菌株的基因组组装与注释结果,该菌株来自D. simulans的祖先分布区。数据验证了M252基因组的高质量,记录了52%多外显子基因的可变剪接、70%基因的UTR注释、225个新基因及781个假基因,为果蝇遗传学研究提供资源。
文件详解
- 文件名称:
README_for_SimulansM252Annotation-r1.1.txt
- 文件格式:TXT
- 字段映射介绍:包含数据使用所需软件(如BEDTools、BLAT等)的安装链接及说明,由Nicola Palmieri提供联系方式。
- 文件名称:
SimulansM252Annotation-r1.1.zip
- 文件格式:ZIP
- 字段映射介绍:基因组注释相关的压缩文件,具体内容需解压后查看。
- 文件名称:
dsim-all-chromosome-M252_draft_4-chrnamesok.fa
- 文件格式:FA
- 字段映射介绍:M252菌株的全染色体基因组组装草稿序列文件。
- 文件名称:
dsim-M252-popgen-ann-r1.1.gtf
- 文件格式:GTF
- 字段映射介绍:M252菌株的基因组注释文件,包含基因结构等信息。
数据来源
论文“Genome assembly and annotation of a Drosophila simulans strain from Madagascar”
适用场景
- 果蝇基因组比较研究: 用于与其他D. simulans菌株组装结果对比,分析基因组差异。
- 基因组注释优化研究: 基于52%多外显子基因可变剪接、70%基因UTR注释等数据,探索注释方法改进方向。
- 新基因与假基因分析: 研究225个新基因及781个假基因的功能与进化意义。
- 进化遗传学研究: 利用祖先分布区菌株的基因组数据,分析D. simulans的进化历程。