SVCFit_结构变异拟合算法基准测试完整数据集

数据集概述

本数据集为SVCFit软件的性能基准测试数据,用于重现相关研究论文中的图表结果。数据包含单克隆和多克隆结构变异模拟的输入文件、VCF变异文件、SVclone软件输出结果以及运行时间记录。数据集通过VISOR工具生成模拟数据,支持结构变异细胞分数推断算法的验证和性能比较。

文件详解

  • 输入文件(input)
  • 文件格式:BED
  • 字段映射介绍:包含用于数据模拟的基因组区域定义文件
  • HACk.random.bed:单克隆模拟使用
  • c1.bed, c2.bed, c3.bed:多克隆模拟使用
  • allele2.bed:VISOR模拟杂合变异所需的空文件
  • 变异文件(VCF)
  • 文件格式:VCF
  • 字段映射介绍:包含模拟生成的结构变异调用结果,按不同细胞分数比例(如c40p20, c40p40等)组织
  • 分析结果文件
  • 文件格式:RData
  • 字段映射介绍:SVclone软件输出的结构变异分析结果,保存为R数据格式
  • 运行时间记录
  • 文件格式:TXT
  • 字段映射介绍:记录SVCFit和SVclone算法的运行时间信息
  • 测序深度数据
  • 文件格式:TXT
  • 字段映射介绍:包含每个模拟样本的测序深度信息

数据来源

Karchin实验室GitHub仓库(https://github.com/KarchinLab/SVCFit

适用场景

  • 结构变异分析算法验证:用于评估SVCFit等算法在结构变异细胞分数推断方面的准确性和性能
  • 生物信息学工具基准测试:比较不同结构变异分析软件的处理速度和结果一致性
  • 癌症基因组学研究:支持肿瘤异质性分析和亚克隆结构变异检测方法开发
  • 模拟数据生成方法研究:为基因组结构变异模拟提供参考实现和测试用例
  • 算法优化与性能分析:基于运行时间数据优化计算密集型基因组分析流程
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 7.94 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。