分子性质预测数据集MolecularPropertyPredictionDataset-virajbagal

分子性质预测数据集MolecularPropertyPredictionDataset-virajbagal

数据来源:互联网公开数据

标签:分子结构, 分子性质, 化学信息学, 机器学习, SMILES, 量子化学, 数据分析, 药物研发

数据概述: 该数据集包含来自多个来源的分子结构与性质信息,旨在为化学信息学研究和机器学习模型训练提供数据支持。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态分子性质快照。 地理范围:数据涵盖了广泛的化学结构,不限定特定地理区域。 数据维度:数据集包含多个CSV文件,其中: qm9.csv:包含QM9数据集的分子结构信息,以及通过量子化学计算得到的多种性质,包括分子几何参数、偶极矩、极化率、HOMO、LUMO、能隙、零点振动能、内能、焓、吉布斯自由能、热容等。 moses.csv:包含SMILES字符串、实验数据和用于评估生成模型的指标。 zinc250k.csv:包含ZINC250k数据库的分子结构信息,以及logP、QED、SAS、分子量(MW)等性质。 数据格式:数据以CSV格式提供,便于数据处理和分析。 来源信息:数据来源于公开的化学数据集,如QM9数据集和ZINC数据库,已进行标准化处理。 该数据集适合用于分子性质预测、药物设计、材料科学等领域的研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于化学信息学、机器学习与计算化学交叉领域的研究,如分子性质预测模型的开发与评估、新药筛选、材料设计等。 行业应用:为药物研发、材料科学等行业提供数据支持,尤其在药物分子性质预测、虚拟筛选、结构优化等方面具有实用价值。 决策支持:支持科学研究和工业应用中的分子设计与优化,加速新材料和新药的研发进程。 教育和培训:作为化学信息学、机器学习、数据科学等课程的实训素材,帮助学生和研究人员深入理解分子性质与结构之间的关系。 此数据集特别适合用于探索分子结构与性质之间的定量关系,构建预测模型,加速药物发现和材料设计。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 67.74 MiB
最后更新 2025年5月29日
创建于 2025年5月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。