儿童急性淋巴细胞白血病药物重定位的蛋白质与配体数据集

数据集概述

本数据集包含蛋白质序列和配体数据两部分,用于儿童急性淋巴细胞白血病(ALL)的药物重定位计算研究。蛋白质序列来自UniProt数据库,配体数据来自ChEMBL、DrugBank及手动补充的FDA批准药物,支持生物信息学、药物发现等领域研究。

文件详解

  • 数据集目录: Protein and Ligand Dataset for Drug Repositioning in Childhood Acute Lymphoblastic Leukemia (ALL)/
  • 文件1: proteins.txt,格式为JSON-like,包含8479条蛋白质序列,以UniProt ID为键、氨基酸序列为值,平均序列长度529.81,最大14507
  • 文件2: ligands.txt,格式为JSON-like,包含约二十二万个药物小分子SMILES字符串,以键值对形式存储
  • 文件3: metadata.txt,格式为TXT,未提供具体内容描述

适用场景

  • 生物信息学研究: 分析儿童ALL相关蛋白质序列特征
  • 药物重定位研究: 基于配体数据挖掘潜在治疗药物
  • 计算生物学建模: 构建药物-靶点相互作用预测模型
  • 白血病治疗靶点发现: 识别ALL发病机制相关蛋白质靶点
  • 系统药理学分析: 探索ALL治疗的多靶点药物作用机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.16 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。