数据集概述
本数据集聚焦陆生根系植物响应土壤微生物压力的基因组趋同现象,核心围绕串联重复(TD)机制展开,包含205个物种的基因演化数据、祖先与特异性TD事件、生物胁迫响应基因及相关分析结果。
文件详解
该数据集由多个目录组成,具体说明如下:
- 205species: 包含205个研究物种的TD、WGD、HGT来源基因、基因家族及TD基因对的Ks值数据
- Ancestral_and_specific_TD_events: 拟南芥、小拟南芥、水稻、菰的祖先及特异性TD事件数据,区分物种分化前后的TD事件类型
- Biotic_stress: 拟南芥和水稻在生物胁迫下的上调基因列表,涉及灰霉病、线虫、假单胞菌等多种病原菌与共生微生物
- GLM_analysis: 物种地理坐标、气候、人为、土壤及植物形态生态变量,以及1000次bootstrap重采样的GLM分析结果
- GO_enrichment: 28个代表性物种的GO术语注释及TD、WGD来源基因家族的富集术语
- MLtree: 10个TD来源基因家族的原始系统发育树文件,基于红藻、绿藻、苔藓、蕨类、裸子植物、被子植物等17个代表性植物构建
- Mangroves: 16个红树林基因组的TD来源基因、基因家族及TD基因对Ks值数据
- Code: 研究使用的代码脚本,包含HGTdetector.sh等
适用场景
- 植物基因组学研究:分析陆生植物响应微生物压力的串联重复基因演化机制
- 生物胁迫响应机制研究:探究根系植物对病原菌和共生微生物的分子应答通路
- 比较基因组学分析:跨物种比较串联重复、全基因组加倍(WGD)等演化事件的差异
- 生态基因组学研究:关联植物基因组特征与土壤微生物、气候、地理环境的关系
- 功能基因组学分析:通过GO富集分析解析TD基因家族的生物学功能