数据集概述
本数据集为直翅目昆虫Gryllus rubens(蟋蟀)的生命周期转录组资源,包含7个发育阶段的RNA-seq数据从头组装结果,涉及27,312条转录本的注释与表达谱分析,涵盖胚胎、若虫至成虫阶段的基因表达模式,是首个覆盖该物种完整个体发育的转录组数据。
文件详解
- 注释转录组文件
- 文件名称:Rubens_transcriptome_annotated.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含转录本的BLAST注释信息、基因本体(GO)术语注释结果,覆盖52%转录本的功能注释与41%的GO分类
- 过滤转录本序列文件
- 文件名称:tr2.fpkm0.5_l600_uniq.fa
- 文件格式:FA
- 字段映射介绍:筛选后的转录本序列,包含FPKM≥0.5、长度≥600bp的唯一转录本序列
- 表达谱输出压缩包
- 文件名称:Rubens_RSEM_output.zip
- 文件格式:ZIP
- 字段映射介绍:RSEM定量分析结果压缩包,包含不同发育阶段转录本的表达量数据
- 原始组装转录本序列文件
- 文件名称:tr2.fasta
- 文件格式:FASTA
- 字段映射介绍:转录组从头组装生成的原始转录本序列文件
- 转录本过滤脚本
- 文件名称:filter_transcripts.py
- 文件格式:PY
- 字段映射介绍:用于筛选转录本的Python脚本,实现基于表达量、长度等条件的转录本过滤功能
数据来源
论文“A genes eye view of ontogeny: De novo assembly and profiling of the Gryllus rubens transcriptome”
适用场景
- 直翅目昆虫发育生物学研究:分析Gryllus rubens胚胎至成虫阶段的基因表达动态与发育调控机制
- 昆虫转录组注释与功能基因组学:利用注释文件开展基因功能预测、GO富集分析及通路注释
- 发育信号通路研究:挖掘Hedgehog、Wnt等保守发育通路相关基因在蟋蟀生命周期中的表达模式
- 昆虫进化生物学分析:通过转录组数据探究直翅目昆虫的基因家族扩张、收缩及进化关系
- 基因表达定量验证:基于RSEM输出的表达谱数据,验证特定基因在不同发育阶段的表达水平