COMP6v2综合机器学习势能基准套件数据集

数据集概述

该数据集是COMP6基准套件的2.0版本扩展,包含含H、C、N、O、S、F、Cl元素分子的密度泛函特性数据,覆盖多种理论水平,以压缩文件、代码和文档形式提供,支持机器学习势能模型训练与测试。

文件详解

  • 压缩数据文件(.tar.gz格式,共4个):
  • COMP6v2_wB97X-631Gd.tar.gz:包含wB97X/631Gd理论水平下的分子密度泛函特性数据
  • COMP6v2-B973c-def2mTZVP.tar.gz:包含B973c/def2mTZVP理论水平下的分子密度泛函特性数据
  • COMP6v2-wB97MV-def2TZVPP.tar.gz:包含wB97MV/def2TZVPP理论水平下的分子密度泛函特性数据
  • COMP6v2-wB97MD3BJ-def2TZVPP.tar.gz:包含wB97MD3BJ/def2TZVPP理论水平下的分子密度泛函特性数据
  • 代码文件:
  • sample_data_loader.py(.py格式):数据加载示例脚本,展示如何使用h5py访问数据集内容
  • 文档文件:
  • supplementary_information.pdf(.pdf格式):补充说明文档,包含数据集格式和内容的详细信息

适用场景

  • 机器学习势能模型训练:用于训练覆盖H、C、N、O、S、F、Cl元素分子的势能模型
  • 计算化学基准测试:在不同理论水平下验证分子密度泛函特性计算方法的性能
  • 数据加载方法研究:参考示例脚本优化大规模分子数据的读取与处理流程
  • 分子特性预测研究:基于多理论水平数据构建高精度分子特性预测模型
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 513.56 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。