数据集概述
本数据集为Gosai等人2024年研究中使用的基因组API模型评估器(GAME)容器相关数据,包含776,474条200bp的MPRA序列(在3种人类细胞系中测量),提供评估器容器、测试预测器容器及相关数据文件,用于基因组模型评估流程的部署与验证。
文件详解
- evaluator_data.zip
- 文件格式:ZIP
- 内容介绍:包含用于评估器容器读取的原始MPRA数据
- gosai_evaluator.sif
- 文件格式:SIF
- 内容介绍:包含评估器容器运行所需的所有依赖和脚本,支持读取原始MPRA数据、解析为API标准格式,并通过TCP套接字连接预测器容器
- test_gosai_predictor.sif
- 文件格式:SIF
- 内容介绍:包含测试预测器容器运行所需的所有依赖和脚本,可与Gosai评估器容器配合使用
数据来源
Gosai, S.J., Castro, R.I., Fuentes, N. et al. Machine-guided design of cell-type-targeting cis-regulatory elements. Nature 634, 1211–1220 (2024). https://doi.org/10.1038/s41586-024-08070-z;GitHub仓库https://github.com/de-Boer-Lab/Genomic-Model-Evaluation-API
适用场景
- 基因组模型评估流程验证:通过评估器容器与测试预测器容器的联动,验证基因组API模型评估流程的可行性
- MPRA序列数据处理测试:使用评估器容器解析原始MPRA序列数据,测试数据格式转换与API适配能力
- 容器化基因组工具部署:基于SIF格式容器文件,快速部署基因组模型评估相关工具链
- 细胞类型靶向顺式调控元件研究辅助:为相关研究提供标准化的模型评估工具支持