数据集概述
本数据集为Shi, Al-Sayyad, & Wasko等人研究“两步快速靶标捕获确保高效CRISPR-Cas9引导基因组编辑”的原始实验数据,包含四十余个文件,按图表分类存储,支持相关研究的验证与扩展分析。
文件详解
该数据集按研究图表分类存储,具体说明如下:
- 原始数据文件(位于Raw_data/目录下,按图表编号分文件夹):
- 数据文件格式:以CSV格式为主,辅以TIFF图像文件
- 核心文件示例:
- Fig1/Fig.1C.csv:包含DSB(双链断裂)百分比数据,字段如DSB (%)_rep1(重复实验1的DSB百分比)、DSB (%)_avg(平均值)、DSB (%)_stddev(标准差)等
- Fig1/Fig.1F.csv:包含蛋白质与时间相关的荧光强度数据,字段如protein(蛋白质类型)、time(时间点)、F.I._avg(平均荧光强度)等
- Fig6/Fig.6B_box_1_4.tif:TIFF格式的实验图像文件
- 文件类型分布:CSV文件二十五个(占比约五十九点五二%),TIFF文件十七个(占比约四十点四八%)
适用场景
- 基因编辑技术研究:分析两步靶标捕获策略对CRISPR-Cas9编辑效率的影响
- 分子生物学实验验证:复现或扩展原研究中关于双链断裂效率、蛋白结合动力学的实验结果
- 生物信息学分析:基于原始数据开发或优化基因编辑效率预测模型
- 基因组学方法优化:探索提高CRISPR-Cas9系统靶向准确性与效率的技术路径