数据集概述
本数据集聚焦全球入侵害虫棉铃虫的迁徙飞行活动,通过系留飞行实验与转录组测序技术,分析不同飞行表型个体的全基因组转录特征。包含飞行距离表型数据、基因表达矩阵、差异表达分析结果及功能注释等文件,揭示迁徙飞行相关的基因表达变化,为昆虫迁徙分子机制研究提供基础数据。
文件详解
- 飞行表型数据
- 文件名称:flight_mill_total distance.csv
- 文件格式:CSV
- 字段映射介绍:记录棉铃虫个体的飞行表型数据,包含ID(个体编号)、origin(来源地)、sex(性别)、Total distance flown(总飞行距离)字段。
- 基因表达矩阵
- 文件名称:china_read_count.matrix.csv、greece_read_count.matrix.csv
- 文件格式:CSV
- 字段映射介绍:记录不同来源样本的基因表达量,行表示基因编号(如HaOG200020),列表示样本编号(如AY1、DF1),数值为基因在对应样本中的读段计数。
- 差异表达分析结果
- 文件名称:deseq2_full_output.xlsx、edgeR_full_output.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含DESeq2和edgeR两种方法分析得到的差异表达基因结果,涵盖基因表达量、差异倍数、显著性水平等统计信息。
- 功能注释文件
- 文件名称:go_terms.txt
- 文件格式:TXT
- 字段映射介绍:记录基因的GO功能注释信息,包含Seq. Name(序列名称)、Seq. Description(序列描述)、#GOs(GO条目数量)、GOs(具体GO功能术语,如F:hydrolase activity、P:metabolic process)。
- qPCR验证数据
- 文件名称:jones_mol_ecol_qpcr_ct.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含qPCR实验的循环阈值(CT值)数据,用于验证转录组分析结果的可靠性。
数据来源
论文“Genome-wide transcriptional signatures of migratory flight activity in a globally invasive insect pest”
适用场景
- 昆虫迁徙分子机制研究: 分析棉铃虫迁徙飞行相关的差异表达基因,探究迁徙行为的转录调控机制。
- 害虫迁徙监测与防控: 基于迁徙相关基因特征,开发棉铃虫迁徙能力的分子标记,为害虫预测预警提供技术支持。
- 比较基因组学分析: 对比不同地理种群棉铃虫的基因表达差异,研究种群适应性进化。
- 功能基因注释与验证: 利用GO注释结果筛选关键功能基因,结合qPCR数据验证基因功能。