分子性质预测QM9数据集_Molecular_Property_Prediction_QM9_Dataset
数据来源:互联网公开数据
标签:分子结构, 量子化学, 机器学习, 分子性质, SMILES, 数据集, 建模, 预测
数据概述:
该数据集包含QM9数据集的子集,记录了基于量子化学计算得到的分子结构及性质数据。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态数据集。
地理范围:数据涵盖了QM9数据集中的分子,这些分子来源于化学空间。
数据维度:数据集包括分子的SMILES字符串、原子数量、转动惯量、偶极矩、极化率、HOMO、LUMO、能隙、零点振动能、内能、焓、吉布斯自由能、比热容以及分子ID等多个属性。
数据格式:CSV格式,文件名为SMILES_QM9_REM3K.csv,方便数据分析和模型构建。数据来源于QM9数据集,经过了预处理和特征提取。
该数据集适用于分子性质预测、分子结构与性质关系研究、机器学习模型训练和评估。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于化学信息学、材料科学等领域的研究,如分子性质预测、分子设计、药物发现等。
行业应用:为化学、材料科学等行业提供数据支持,尤其是在新材料研发、药物筛选、分子设计等方面。
决策支持:支持新材料开发、药物研发等领域的决策制定和策略优化。
教育和培训:作为化学、机器学习等课程的辅助材料,帮助学生和研究人员深入理解分子结构与性质的关系,以及机器学习在化学领域的应用。
此数据集特别适合用于探索分子结构与性质之间的内在联系,构建预测模型,实现对分子性质的准确预测,从而加速新材料和药物的研发进程。