数据集概述
本数据集为iwc工作流的测试数据,包含Purgedups VGP6相关的基因组组装及分析文件,涵盖预估基因组大小参数、Hifiasm组装结果、Meryl数据库、Genomescope模型参数和Pacbio测序数据等,共6个文件,用于生物信息学工作流的测试验证。
文件详解
- 预估基因组大小参数文件
- 文件名称:Estimated genome size - Parameter File.expression.json
- 文件格式:JSON
- 字段映射介绍:包含预估基因组大小的参数信息
- Hifiasm替代组装文件
- 文件名称:Hifiasm Alternate assembly.fasta
- 文件格式:FASTA
- 字段映射介绍:Hifiasm组装生成的替代基因组序列文件
- Meryl数据库文件
- 文件名称:Meryl Database.meryldb
- 文件格式:meryldb
- 字段映射介绍:Meryl工具生成的基因组k-mer数据库文件
- Genomescope模型参数文件
- 文件名称:Genomescope model parameters.tabular
- 文件格式:tabular
- 字段映射介绍:Genomescope基因组特征分析模型的参数文件
- Hifiasm主要组装文件
- 文件名称:Hifiasm Primary assembly.fasta
- 文件格式:FASTA
- 字段映射介绍:Hifiasm组装生成的主要基因组序列文件
- Pacbio测序数据文件
- 文件名称:Pacbio Reads Collection - Trimmed_yeast_reads_sub1.fastq.gz.fastq.gz
- 文件格式:GZ
- 字段映射介绍:经过修剪的Pacbio酵母测序数据压缩文件
适用场景
- 生物信息学工作流测试:验证iwc工作流的运行逻辑和处理能力
- 基因组组装方法评估:对比Hifiasm组装结果的准确性和完整性
- 基因组特征分析:利用Genomescope模型参数研究基因组结构特征
- 测序数据处理测试:测试Pacbio测序数据的预处理和分析流程