数据集概述
本数据集是论文《Using reciprocally retained gene families to detect whole-genome multiplications in plants》的补充数据,包含研究中计算分析的输入与输出文件,涉及植物全基因组倍增检测相关的基因家族分析、统计模型等内容,共8个文件。
文件详解
- 文件名称:README.docx
- 文件格式:DOCX
- 字段映射介绍:作为说明文档,包含数据集的背景、文件说明、使用方法等信息
- 文件名称:3.lambda_ranking_when_including_Cucumis_WGM.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含纳入Cucumis物种全基因组倍增(WGM)分析时的lambda排序相关数据
- 文件名称:5.cLRTs_on_extended_trees.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含扩展进化树上的复合似然比检验(cLRTs)分析结果数据
- 文件名称:original_angiosperm_sequences.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含原始被子植物基因序列数据
- 文件名称:4.cLRTs_on_small_clades.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含小进化分支上的复合似然比检验(cLRTs)分析结果数据
- 文件名称:1.cLRTs_37speciestree_top100_plus_five_bottom_50.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含基于37个物种树的前100和后50基因家族的复合似然比检验(cLRTs)分析结果数据
- 文件名称:2.WGTs_modelled_as_WGDs.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含将全基因组三倍化(WGTs)建模为全基因组倍增(WGDs)的分析数据
- 文件名称:6.WGDgc.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含全基因组倍增基因共线性(WGDgc)相关分析数据
数据来源
论文“Using reciprocally retained gene families to detect whole-genome multiplications in plants”(作者Tasdighian S *, Sensalari C * and Maere S,2025)
适用场景
- 植物基因组进化研究:用于分析植物全基因组倍增事件的发生机制与进化模式
- 基因家族分析:基于互惠保留基因家族数据,研究植物基因家族的扩张与收缩规律
- 生物信息学统计模型验证:利用cLRTs等统计检验结果,验证植物基因组分析中的模型假设
- 被子植物基因序列分析:基于原始被子植物序列数据,开展基因功能与进化关系研究
- 植物多倍体检测技术优化:通过不同分析方法(如WGTs建模为WGDs)的对比,优化全基因组倍增检测算法