数据集概述
本数据集包含2017年9月从MalAvi平台获取的禽血孢子虫(Plasmodium、Haemoproteus、Leucocytozoon)宿主特异性相关数据,以及通过RAxML构建的系统发育树文件,同时提供用于数据处理与分析的R代码及分类关联文件,支撑宿主特异性与系统发育信号的关联性研究。
文件详解
- 系统发育树文件:
- RAxML_bipartitions.Plas_edited_MalAvi_longseqs_13Sep2017:Plasmodium属系统发育树文件
- RAxML_bipartitions.Haem_edited_MalAvi_longseqs_13Sep2017:Haemoproteus属系统发育树文件
- RAxML_bipartitions.Leuc_edited_MalAvi_longseqs_13Sep2017:Leucocytozoon属系统发育树文件
- 数据文件:
- Hosts and Sites Table 14September2017.csv:CSV格式,包含Lineage_Name、parasiteGenus、family、species、continent、country等宿主与采样点字段
- Table of References 14September2017.csv:CSV格式,包含Reference_Name、year、title、journal等文献参考字段
- Grand Lineage Summary 14September2017.csv:CSV格式,谱系汇总数据
- R代码文件:
- clean_names.R、clean_alignment.r、extract_alignment.R、extract_table2.r:用于数据清洗、序列提取的R脚本
- 分类关联文件:
- taxonomy.rda:R数据文件,包含MalAvi与birdtree.org的宿主分类关联数据
数据来源
MalAvi(http://mbio-serv2.mbioekol.lu.se/Malavi/)
适用场景
- 寄生虫学研究:分析禽血孢子虫不同属种的宿主特异性特征
- 系统发育分析:探究宿主特异性在不同分类阶元(姐妹支系与大进化枝)中的系统发育信号
- 生物信息学方法应用:验证RAxML构建系统发育树在寄生虫宿主关系研究中的适用性
- 数据挖掘实践:利用R代码复现或扩展MalAvi平台数据的获取与分析流程