多洛数据新型距离研究数据集

数据集概述

该数据集围绕多洛过程(Dollo process)下的二元(存在/缺失)数据距离展开研究,引入了新型的加性多洛距离(ADD),通过模拟数据对比多种二元距离的性能,并将ADD应用于桉树DArT数据集和细菌基因家族数据,提供相关案例分析结果。

文件详解

  • 案例研究文件(.nex格式):
  • Adnataria_casestudy.nex:桉树Adnataria系列案例研究数据文件
  • Eucalyptus_casestudy.nex:桉树物种案例研究数据文件
  • Cogs_casestudy.nex:细菌COG数据库基因家族案例研究数据文件
  • padd_Dollo_template.nex:多洛数据模板文件
  • 程序文件:
  • add_Dollo_dist.pl:ADD距离计算的Perl脚本
  • 文档文件(.pdf格式):
  • Provenance information for Adnataria.pdf:Adnataria案例研究来源信息文档
  • OnlineSupplementaryMaterial.pdf:在线补充材料文档

适用场景

  • 系统发育学研究:用于多洛过程下二元性状数据的距离计算与系统发育树构建
  • 基因组数据分析:应用于基因家族存在/缺失数据的系统发育分析
  • 植物分类学研究:支持桉树等物种的系统发育关系解析
  • 生物信息学方法评估:对比不同二元距离在多洛数据中的性能表现
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.7 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。