数据集

化合物活性预测分子结构数据集CompoundActivityPredictionMolecularStructureDataset-nadjibdjellali

数据来源：互联网公开数据

标签：药物发现, 化学信息学, 分子结构, SMILES, 机器学习, 活性预测, ChEMBL, 数据挖掘

数据概述：该数据集包含来自ChEMBL数据库的化合物分子结构信息，用于药物活性预测。主要特征如下：时间跨度：数据未明确标注时间，可视为静态数据集。地理范围：数据来源于ChEMBL数据库，包含全球范围内的化合物信息。数据维度：数据集包括“Molecule ChEMBL ID”（化合物在ChEMBL数据库中的唯一标识符）、“Smiles”（Simplified Molecular Input Line Entry System，简化分子线性输入规范，用于描述分子结构）以及“Activity_status”（活性状态，仅在train.csv中存在）三个字段。数据格式：CSV格式，包含train.csv和test.csv两个文件，便于进行分子结构分析和机器学习建模。来源信息：数据来源于ChEMBL数据库，经过预处理，提供了化合物的分子结构信息和活性状态（train.csv）。该数据集适合用于化合物结构与活性关系的建模、药物筛选和预测等研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于药物设计、化学信息学、药理学等领域的学术研究，如预测化合物的生物活性、构建药物-靶标相互作用模型等。行业应用：为药物研发企业提供数据支持，尤其在虚拟筛选、先导化合物发现、药物优化等方面具有实用价值。决策支持：支持药物研发过程中的早期筛选和优先级排序，加速新药的研发进程。教育和培训：作为化学信息学、药物设计等课程的实训素材，帮助学生和研究人员理解分子结构与生物活性的关系。此数据集特别适合用于探索分子结构与生物活性之间的联系，并构建预测模型，从而加速药物发现和优化过程。

数据与资源

化合物活性预测分子结构数据集CompoundActivityPredictionMolecul...ZIP
0.06 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.06 MiB
最后更新	2025年5月12日
创建于	2025年5月12日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

化合物活性预测分子结构数据集CompoundActivityPredictionMolecularStructureDataset-nadjibdjellali

数据与资源

附加信息

注册成功！