药物-靶标相互作用预测数据集Drug-TargetInteractionPredictionDataset-researchhusni
数据来源:互联网公开数据
标签:药物研发, 靶标相互作用, 机器学习, 分子结构, 蛋白质序列, 亲和力, 预测模型, 生物信息学
数据概述:
该数据集包含用于药物-靶标相互作用(DTI)预测的数据,记录了药物分子结构、靶标蛋白质序列以及它们之间的亲和力值。主要特征如下:
时间跨度:数据集未明确标注时间,可视为用于训练和评估DTI预测模型的静态数据。
地理范围:数据覆盖全球范围内的药物和蛋白质靶标。
数据维度:包括药物的SMILES字符串(简化分子线性输入规范)、靶标蛋白质序列、以及药物与靶标之间的亲和力值(affinity)。
数据格式:数据集以CSV格式存储,包含kiba_train.csv, kiba_test.csv, davis_train.csv, davis_test.csv, kiba_full.csv, davis_full.csv 共6个文件,便于数据处理和分析。同时包含txt文件,用于划分训练集、验证集和测试集。
来源信息:数据来源于药物研发领域,经过标准化处理,适用于DTI预测模型的训练与评估。
该数据集适合用于药物研发、靶标识别等领域的研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于药物发现与设计的学术研究,例如DTI预测、药物活性预测、靶标识别等。
行业应用:可以为制药公司和生物技术公司提供数据支持,用于药物筛选、药物重定向、个性化用药等。
决策支持:支持药物研发过程中的决策,加速药物研发流程,降低研发成本。
教育和培训:作为生物信息学、机器学习等相关课程的实训材料,帮助学生和研究人员深入理解DTI预测。
此数据集特别适合用于探索药物分子结构与靶标蛋白质序列之间的复杂相互作用关系,构建和优化DTI预测模型,从而实现对药物活性的预测和对潜在药物靶标的识别。