数据集概述
本数据集为蝉科(Cicadidae)系统发育基因组研究中的样本污染检测与清理相关数据,包含污染检测自动化流程的应用结果、基因组分析统计、系统发育数据表格及分析结果压缩包,支持蝉科系统发育关系研究及污染数据处理方法验证。
文件详解
- README.md
- 文件格式:MD
- 字段映射介绍:Dryad提交说明文档,描述主目录文件内容及压缩文件内附加说明文档的位置。
- Family_Cicadidae_AHE_genomic_analysis_samples.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含多标签页的Excel文件,其中"contamination-gene-align-stats"标签页记录污染基因比对统计信息(具体字段未完全展示)。
- Table_S2.xlsx
- 文件格式:XLSX
- 字段映射介绍:系统发育研究相关的补充表格数据(具体字段未展示)。
- Phylogenetic_data_analysis_results_and_log_files.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含系统发育数据分析结果文件及日志文件,内部有附加README.md描述具体内容。
- Table_S1.docx
- 文件格式:DOCX
- 字段映射介绍:系统发育研究相关的补充表格文档(具体字段未展示)。
数据来源
Dryad submission for Owen et al. (2022) Systematic Biology(https://doi.org/10.1093/sysbio/syac043)
适用场景
- 系统发育基因组污染检测:验证基于遗传距离双峰分布的污染位点自动检测流程效果。
- 蝉科系统发育关系研究:利用清理后的429个基因座数据,分析蝉科亚科、族级分类单元的系统发育关系。
- 基因组数据质量控制:探索长枝效应、同源序列数量等指标与样本污染的相关性。
- 分子系统发育方法优化:比较污染数据清理前后对系统发育树拓扑结构及分支支持率的影响。
- 分类学修订支持:结合基因组数据与形态学证据,辅助蝉科分类单元的分类地位修订(如Aragualna属的亚科归属调整)。