MCF7细胞系靶向药物化学活性数据集-2023-sabetm
数据来源:互联网公开数据
标签:MCF7,细胞系,药物发现,QSAR,计算化学,生物活性,药物筛选,药物机制,安全性
数据概述:
本数据集来源于著名的生物活性分子数据库ChEMBL,包含具有药物活性特性的分子信息。数据集中的特征信息来源于ChEMBL的不同表格,包括分子性质、生物活性数据、靶点信息和安全性警告等。本数据集特别聚焦于针对MCF7细胞系进行测试的化合物,MCF7细胞系广泛用于乳腺癌研究。
数据集包括关键的分子描述符(如分子量、LogP、氢键供体和受体数目、极性表面积等)以及重要的生物活性值(如IC50、EC50和Ki),还提供了药物作用机制、药物适应症及潜在安全性问题的见解。
该数据集可作为药物发现、QSAR建模、计算化学中机器学习应用等领域的宝贵资源。
数据用途概述:
该数据集适用于药物发现、QSAR(定量结构-活性关系)建模、计算化学中的机器学习应用等场景。研究者可以利用此数据集进行药物筛选、生物活性预测、药物作用机制分析及安全性评估。该数据集对于推动乳腺癌相关药物的研发具有重要意义。
特征概述:
molregno:分子的唯一标识符。
iupac_name:分子的IUPAC名称。
canonical_smiles:分子结构的SMILES表示法。
molecular_weight:化合物的分子量。
alogp:辛醇-水分配系数的对数。
hba:分子中的氢键受体数目。
hbd:分子中的氢键供体数目。
psa:分子的极性表面积。
rtb:分子中的可旋转键数目。
ro3_pass:分子是否通过Rule of 3(药物类性质的评判标准)。
num_ro5_violations:违反Lipinski's Rule of 5的次数。
cx_logp:辛醇-水分配系数的对数。
cx_logd:在特定pH下的分配系数的对数。
molecular_species:分子物种类型(例如,中性、阴离子、阳离子)。
qed_weighted:药物类性质的定量估计。
np_likeness_score:与天然产物相似性的评分。
ic50_value:IC50值,表示化合物的抑制活性。
ic50_units:IC50值的单位。
standard_relation:报告的活性值与实际测量值之间的关系,通常包括=, , ≤, ≥等符号。
target_name:生物靶点的名称。
target_type:生物靶点的类型(例如,酶、受体)。
cell_description:用于检测的细胞系描述。
disease_name:与分子相关的疾病名称。
disease_category:疾病的类别(例如,癌症、心血管)。
mechanism_of_action:药物的作用机制。
action_type:药物的作用类型(例如,激动剂、拮抗剂)。
warning_type:与药物相关的警告类型。
warning_description:警告的描述。