数据集概述
该数据集为Prime Editing小分子调节剂识别的测试数据,用于基准测试和验证Edit-o-Matic基因组编辑软件。包含基因组测序原始数据、结果分析文档及可视化文件等,覆盖多个基因靶点与测序平台对比场景。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 描述文档:
- Full test data description.pdf: PDF格式,测试数据说明文档
- Full test data description.docx: DOCX格式,测试数据说明文档
- Full test data description-S7VTzR.docx: DOCX格式,测试数据说明文档
- Full test data description-Q3AQuC.pdf: PDF格式,测试数据说明文档
- 基因靶点原始测序数据:
- HIF1A_bulk目录: 包含HIF1A基因靶点的bulk测序数据,如EXP-NBD196_barcode21.fastq(FASTQ格式)
- KEAP1目录: 包含KEAP1基因靶点的重复测试数据,如rep_1_test_400.fastq(FASTQ格式)
- Illumina目录: 按Barcode分类存储Illumina平台测序数据,如barcode1/9_S9_L001_R1_001.fastq(FASTQ格式)
- PE_HBG1_HBG2/fastq目录: 包含HBG1、HBG2基因靶点的测序数据,如insertion.txt(TXT格式)
- offtarget/HBB目录: 包含HBB基因脱靶测序数据,如SRR7299000.fastq(FASTQ格式)
- 测序平台对比结果:
- comparison_ONT_illumina/bulk目录: 包含ONT与Illumina平台对比的结果文档,如Result_AHR (9).html(HTML格式)、bulk.csv(CSV格式,含Illumina与ONT数据对比)
- comparison_ONT_illumina/single_clone目录: 包含单克隆样本的平台对比结果,如TREM2.csv(CSV格式,含Illumina与ONT数据对比)、HIF1A_correlation_plot.png(PNG格式,相关性可视化图)
适用场景
- 基因组编辑软件验证: 用于Edit-o-Matic等基因组编辑软件的基准测试与性能验证
- 小分子调节剂研究: 分析小分子对Prime Editing效率的调控作用
- 测序技术对比: 探究ONT与Illumina测序平台在基因编辑检测中的差异
- 基因编辑靶点分析: 研究HIF1A、KEAP1、HBG1等基因靶点的编辑效果
- 生物信息学方法开发: 用于基因编辑数据分析算法的开发与测试