数据集

分子结构与蛋白质结合预测数据集MoleculeStructureandProteinBindingPredictionDataset-seshurajup

数据来源：互联网公开数据

标签：分子结构, 蛋白质结合, SMILES, 机器学习, 生物化学, 药物研发, 分子建模, 化学信息学

数据概述：该数据集包含分子结构相关的化学信息，记录了不同分子与蛋白质结合的预测结果。主要特征如下：时间跨度：数据未标明具体时间，可视为静态数据集。地理范围：数据未限定地理范围，主要关注分子结构与蛋白质相互作用。数据维度：数据集包含多个关键字段，包括： id：样本唯一标识符； buildingblock1_smiles, buildingblock2_smiles, buildingblock3_smiles：三种不同的building block的SMILES字符串，用于描述分子结构片段； molecule_smiles：完整分子的SMILES字符串； protein_name：蛋白质名称； binds：表示分子与蛋白质结合的二元标签（0或1）。数据格式：CSV格式，包含train_0.csv, train_1.csv以及buildingblock相关的.csv文件，便于数据分析和建模。来源信息：数据来源于化学信息学或生物信息学相关研究，用于分子结构与蛋白质相互作用的预测。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于药物研发、蛋白质结构预测和分子模拟等领域的学术研究。行业应用：可用于药物筛选、靶点识别、药物设计等相关行业，加速新药研发进程。决策支持：支持药物研发过程中的化合物筛选和优化，辅助科学家进行决策。教育和培训：作为化学、生物学和计算机科学等相关学科的教学辅助材料，帮助学生理解分子结构与生物活性之间的关系。此数据集特别适合用于探索分子结构与蛋白质结合之间的定量关系，预测特定分子与蛋白质结合的概率，并为药物设计提供数据支持。

数据与资源

versions_20250319021322.zipZIP
142.68 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	142.68 MiB
最后更新	2025年5月5日
创建于	2025年5月5日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

分子结构与蛋白质结合预测数据集MoleculeStructureandProteinBindingPredictionDataset-seshurajup

数据与资源

附加信息

注册成功！