Gosai_2024_Synthetic_CREs_Based_51k_GAME_API合成调控元件完整数据

数据集概述

本数据集包含用于GAME API的合成CREs(顺式调控元件)评估工具及相关数据,涉及51,000条合成序列在三种细胞系中的表达预测与性能评估,可用于检测模型在基因组数据训练中的序列泄漏问题。

文件详解

  • 主评估工具文件:
  • Gosai_2024_Synthetic_Evaluator.sif: SIF格式文件,包含连接GAME API预测器的处理脚本、解析预测结果与计算性能指标的脚本,以及所有软件依赖
  • 评估数据压缩包:
  • evaluator_data.zip: ZIP格式压缩包,包含子文件:
  • 41586_2024_8070_MOESM14_ESM.txt: 序列文件及对应实测log2fc值(共77,157条序列,实际使用51,000条合成序列)
  • 41586_2024_8070_MOESM6_ESM.xlsx: 序列设计详情文档

适用场景

  • 基因组模型性能评估: 检测模型在K562、HepG2、SK-N-SH细胞系中的表达预测准确性
  • 合成序列设计验证: 验证"Simulated_Annealing"等三种方法设计的合成CREs的实验有效性
  • 生物信息学工具开发: 用于GAME API相关预测工具的性能测试与优化
  • 基因组数据训练优化: 最小化模型训练中的序列泄漏问题研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 150.26 MiB
最后更新 2025年12月18日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。