数据集概述
本数据集为Amplicon_sorter工具的配套数据,该工具用于基于序列相似性和长度对Oxford Nanopore Technologies(ONT)测序的扩增子进行无参考排序,并构建高质量共识序列。数据集包含6个文件,支持工具的使用与验证,适用于生态学研究中扩增子测序数据的分析。
文件详解
- README.txt
- 文件格式:TXT
- 字段映射介绍:工具说明文档,包含Amplicon_sorter的功能描述、作者信息及各数据文件的用途说明
- HAC_data.zip
- 文件格式:ZIP
- 字段映射介绍:高准确性(HAC)测序模式下的扩增子数据压缩包
- supHAC_data.zip
- 文件格式:ZIP
- 字段映射介绍:超高准确性(supHAC)测序模式下的扩增子数据压缩包
- barcode_sequences.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含不同条形码的序列信息
- barcodes_species.xlsx
- 文件格式:XLSX
- 字段映射介绍:物种与对应条形码的关联列表
- Sanger_references.fasta
- 文件格式:FASTA
- 字段映射介绍:桑格测序参考序列文件
数据来源
根特大学Andy Vierstraete与Bart P. Braeckman实验室
适用场景
- 扩增子测序数据分析: 用于ONT扩增子测序数据的无参考排序与共识序列构建
- 生物信息学工具验证: 支持Amplicon_sorter工具的功能测试与性能评估
- 生态学物种鉴定: 结合条形码与物种关联数据,辅助环境样本中的物种分类鉴定
- 测序技术比较研究: 利用HAC和supHAC模式数据,分析不同ONT测序模式的扩增子数据质量差异