药物化学性质数据库DrugChemicalPropertiesDatabase-ahmedelmaamounamin
数据来源:互联网公开数据
标签:药物, 化学性质, 分子结构, 药理学, 生物活性, ChEMBL, 数据挖掘, 机器学习
数据概述:
该数据集包含来自ChEMBL数据库的药物化学性质信息,记录了多种药物分子的结构、理化性质、生物活性等数据。主要特征如下:
时间跨度:数据未标明具体时间,可视为静态药物分子数据库。
地理范围:数据涵盖全球范围内已知的药物分子。
数据维度:数据集包括“ChEMBL ID”(ChEMBL数据库的唯一标识符)、“Name”(药物名称)、“Synonyms”(同义词)、“Type”(药物类型)、“Max Phase”(临床试验阶段)、“Molecular Weight”(分子量)、“Targets”(作用靶标)、“Bioactivities”(生物活性数据)、“AlogP”(计算脂水分配系数)、“Polar Surface Area”(极性表面积)、“HBA”(氢键受体数量)、“HBD”(氢键供体数量)、“RO5 Violations”(违反Lipinski法则的次数)、“Rotatable Bonds”(可旋转键的数量)、“Passes Ro3”(是否通过Rule of 3)、“QED Weighted”(QED加权值)、“CX Acidic pKa”(酸性解离常数)、“CX Basic pKa”(碱性解离常数)、“CX LogP”(计算的logP值)、“CX LogD”(计算的logD值)、“Aromatic Rings”(芳香环数量)、“Structure Type”(结构类型)、“Inorganic Flag”(无机物标志)、“Heavy Atoms”(重原子数量)、“HBA (Lipinski)”(Lipinski法则下的氢键受体数量)、“HBD (Lipinski)”(Lipinski法则下的氢键供体数量)、“RO5 Violations (Lipinski)”(Lipinski法则下的违反次数)、“Molecular Weight (Monoisotopic)”(单一同位素分子量)、“Np Likeness Score”(自然产物相似性评分)、“Molecular Species”(分子类型)、“Molecular Formula”(分子式)、“Smiles”(简化分子线性输入规范)、“Inchi Key”(国际化学标识符)。
数据格式:CSV格式,文件名为All Drugs.csv,便于数据分析和建模。
该数据集包含大量药物的化学结构和性质信息,适合用于药物研发、筛选和分析。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于药物化学、药理学、生物信息学等领域的研究,如药物分子性质预测、结构活性关系研究、药物靶标分析等。
行业应用:可为药物研发、药物筛选、药物设计等行业提供数据支持,尤其在先导化合物的发现和优化方面具有重要价值。
决策支持:支持药物研发过程中的靶点选择、药物分子设计、临床试验方案优化等决策。
教育和培训:作为药物化学、计算化学、药学等相关课程的辅助材料,帮助学生和研究人员深入理解药物分子的性质和结构,以及它们与生物活性的关系。
此数据集特别适合用于探索药物分子结构与性质之间的关系,以及预测药物的生物活性,从而加速药物研发过程。