蛋白质靶标结合亲和力预测数据集ProteinTargetBindingAffinityPrediction-yusaku5739
数据来源:互联网公开数据
标签:蛋白质, 药物研发, 机器学习, 分子对接, 结合亲和力, 结构生物学, 小分子, 药理学
数据概述:
该数据集包含来自yusaku5739的公开数据,记录了小分子化合物与蛋白质靶标的结合亲和力数据。主要特征如下:
时间跨度:数据未明确时间戳,可视为静态数据集。
地理范围:数据未明确地理范围,但涉及蛋白质靶标,可能来源于多个研究机构。
数据维度:数据集包含小分子的SMILES字符串(分子结构简式)、结合亲和力(bind_ratio)以及交叉验证的fold信息。
数据格式:数据以CSV格式提供,包含BRD4_fold.csv、HSA_fold.csv和sEH_fold.csv三个文件,每个文件代表不同的蛋白质靶标。
来源信息:数据来源于yusaku5739的公开分享,提供了小分子化合物与蛋白质靶标结合亲和力的数据,可用于药物发现和计算生物学研究。
该数据集适合用于药物设计、蛋白质-配体相互作用研究和机器学习模型的训练。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于药物研发、计算化学和生物信息学等领域的学术研究,例如蛋白质-配体相互作用分析、结合亲和力预测模型构建、药物虚拟筛选等。
行业应用:可以为药物研发公司和生物技术企业提供数据支持,特别是在药物靶标验证、先导化合物优化、药物设计等领域。
决策支持:支持药物研发项目的早期阶段,通过预测结合亲和力,优化药物候选分子的选择。
教育和培训:作为计算化学、生物信息学和药物设计等课程的辅助材料,帮助学生和研究人员深入理解蛋白质-配体相互作用。
此数据集特别适合用于构建和验证结合亲和力预测模型,加速药物发现流程,并探索小分子与蛋白质靶标之间的相互作用规律。