单药治疗药物反应预测跨研究基准数据集

数据集概述

该数据集为单药治疗药物反应预测的跨研究基准数据,整合了细胞系药物反应、多组学、药物特征及建模分区数据。数据源于五个药理基因组学研究,经统一流程处理,包含药物反应指标、细胞系多组学信息、药物分子特征及训练验证测试分区文件。

文件详解

  • 文件名称: csa_data.zip:压缩包格式,包含四类核心数据
  • 细胞系药物反应数据:来自CCLE、CTRPv2等五研究,含AUC、IC50等剂量独立反应指标
  • 细胞系多组学数据:源于DepMap门户,含基因表达、DNA突变等多组学类型
  • 药物特征数据:基于PubChem的SMILES字符串,由Mordred和RDKit计算分子指纹与描述符
  • 数据分区文件:由IMPROVE基准流程生成,定义模型训练、验证、测试样本划分

适用场景

  • 药物反应预测模型训练与评估
  • 跨数据集泛化能力分析研究
  • 多组学数据与药物特征关联挖掘
  • 药理基因组学领域基准测试开发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 275.19 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。