数据集概述
本数据集围绕被子植物从陆生到水生过渡过程中的基因组变化与适应机制展开,包含物种生活习性、系统发育树、基因家族数量、微生物多样性及统计分析结果等多维度数据,为研究植物水生适应性进化提供支撑。
文件详解
- 压缩文件: GCAA.zip(Gradient Convergence of Aquatic Angiosperms),包含以下文件及目录:
- Life_habit_dataset.txt: 记录被子植物生活习性(水生/陆生)及生长形式(草本/木本)的数据集
- plant_megatree.tre: 用于祖先状态重建的系统发育树文件
- FigS1_genus.tree: 用于推断水生-陆生习性转换次数的属水平系统发育树
- family_test.txt: 2,638个非冗余基因家族在各物种中的基因数量数据
- 232genefamiliesPCA.txt: 232个水生植物收缩基因家族的PCA分析源数据
- 232genefamiliesPCA_results.txt: 232个基因家族的主成分分析结果
- Microbial_α-_and_β-diversity.xlsx: 陆生与水生栖息地微生物α和β多样性数据
- data_on_Cenozoic.txt: 新生代期间水生植物占被子植物比例变化数据
- Monocots_glm_results.txt: 单子叶与非单子叶植物的广义线性模型分析结果
- gene_function_annotation/: 包含28个水生植物基因功能预测结果的目录
- Orthogroups_genecounts.txt: 不同物种各直系同源群的基因计数数据
- variables_cell: 各单元对应的水生植物频率及地理环境变量数据
- 232_gene_families_of_non-angiosperms.txt: 非被子植物中232个基因家族的基因数量
- GLM_orthogroups.txt: 直系同源群的广义线性模型分析结果
- Figure_orthogroup_results.docx: 直系同源群分析结果的图表文档
- code.R: 本研究使用的R代码文件
适用场景
- 植物进化生物学研究:分析被子植物从陆生到水生过渡的基因组适应机制
- 比较基因组学分析:探究水生植物基因家族收缩与扩张的进化模式
- 微生物生态学研究:评估陆生与水生栖息地微生物多样性差异及其影响
- 古植物学分析:研究新生代期间水生植物比例变化的环境驱动因素
- 统计模型验证:复现或扩展本研究中的系统发育分析及广义线性模型结果