数据集概述
本数据集为松食叶蜂(Neodiprion lecontei)环境响应基因家族进化研究的配套数据,包含手动注释的基因序列、多物种比对文件及附录表格,覆盖嗅觉受体、味觉受体、细胞色素P450等5类基因家族,支持基因进化规律及适应性遗传变化的分析验证。
文件详解
- 说明文档
- 文件名称:README.md
- 文件格式:MD
- 字段映射介绍:数据集说明文档,介绍数据内容、文件类型及对应基因家族信息。
- 基因序列文件
- 文件名称:Nlec_manual_gene_annotation_sequences.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含松食叶蜂手动注释的基因序列(氨基酸及cDNA序列)。
- 多物种比对文件(共5个.fasta文件)
- 文件名称:OR_intact_350AAmin_AmArCcDmHsNlNv_mafftLinsi.fasta
- 对应基因家族:嗅觉受体(OR)
- 文件名称:GR_intact_350AAmin_AmArCcDmHsNlNv_mafftLinsi.fasta
- 对应基因家族:味觉受体(GR)
- 文件名称:OBP_intact_100AAmin_AmCcDmHsNlNv_mafftLinsi.fasta
- 对应基因家族:气味结合蛋白(OBP)
- 文件名称:CYP450_intact_350AAmin_AmDmPbNlNv_mafftGinsi.fasta
- 对应基因家族:细胞色素P450(CYP450)
- 文件名称:HisnavicinFullAlignment_AmDmHsNlNv.fasta
- 对应基因家族:抗菌肽相关(Hisnavicin)
- 文件格式:FASTA
- 字段映射介绍:包含松食叶蜂及其他物种(如蜜蜂、果蝇等)的基因序列比对结果,序列长度≥100/350氨基酸。
- 附录表格文件
- 文件名称:AppendixB_tables.xlsx
- 文件格式:XLSX
- 字段映射介绍:研究附录B的表格数据,补充基因家族进化分析的相关信息。
数据来源
论文“Evolution of five environmentally responsive gene families in a pine-feeding sawfly, Neodiprion lecontei (Hymenoptera: Diprionidae)”
适用场景
- 昆虫基因家族进化研究:分析松食叶蜂环境响应基因家族的扩张、收缩及选择压力。
- 比较基因组学分析:通过多物种序列比对,探究基因家族的保守性与特异性。
- 适应性进化机制研究:验证环境响应基因对松食叶蜂宿主专一性(松树取食)的适应性作用。
- 基因功能注释参考:为昆虫环境响应基因(嗅觉、解毒、免疫相关)的功能注释提供序列数据支持。