甲型流感病毒K_mer基高效基因组监测数据库

数据集概述

本数据集为甲型流感病毒基因组监测设计的K-mer基数据库,包含50个亚型的独特子序列,涵盖18种血凝素(HA)和11种神经氨酸酶(NA)亚型。基于NCBI 2022年5月数据构建,通过泛基因组工具生成亚型特异性及共享序列,支持高效亚型分类。

文件详解

该数据集以ZIP压缩包形式提供,包含对应74、150、300核苷酸读长的三个文件夹,每个文件夹内文件说明如下: - 核心文件(按功能分类): - 可分配数据文件(1_dispensable.fasta至8_dispensable.fasta):FASTA格式,包含甲型流感病毒8个基因组片段的可分配基因组片段 - 独特数据文件(1_unique.fasta至8_unique.fasta):FASTA格式,包含各片段的独特基因组片段;推荐用于亚型分型的4_unique.fasta(片段4)和6_unique.fasta(片段6) - 综合泛基因组文件: - pangenome.fasta:FASTA格式,整合所有8个片段的独特及可分配基因组片段 - unique.fasta:FASTA格式,仅包含所有8个片段的独特基因组片段 - 4_6_unique.fasta:FASTA格式,仅包含片段4和6的独特泛基因组片段,涵盖18种H型和11种N型,为推荐的甲型流感亚型分型文件

数据来源

NCBI数据库、GitHub(PanGen-InfluenzaA工具)

适用场景

  • 流感病毒监测:支持甲型流感病毒基因组读长的高效比对与亚型分类
  • 病毒基因组研究:用于分析甲型流感病毒8个基因组片段的独特及共享序列特征
  • 生物信息学应用:作为泛基因组分析工具的参考数据集,优化亚型分型算法
  • 公共卫生防控:辅助快速识别流感病毒亚型,提升疫情监测效率
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 13.82 MiB
最后更新 2025年12月18日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。