数据集

gp_net_Based_基于熵的图神经网络主动学习材料性能实验复现数据

数据集概述

本数据集包含复现论文“Entropy based active learning of graph neural networks for materials properties”所需的全部数据与模型文件，包括训练数据、训练好的Megnet模型参数、主动学习结果、潜空间向量及可视化代码等，支持材料性能预测实验的复现与分析，共含18个文件。

文件详解

训练数据文件
文件名称：formation_energy_per_atom_data.pkl
文件格式：PKL
字段映射介绍：来自Materials Project的训练数据，用于材料性能预测模型的训练
模型参数文件
文件名称：fitted_formation_energy_per_atom_model.hdf5、fitted_formation_energy_per_atom_model.hdf5.json
文件格式：HDF5、JSON
字段映射介绍：保存的Megnet模型训练参数，JSON文件包含graph_converter、target_scaler、metadata等元数据
主动学习结果文件
文件名称：gp_mae_entropy.npy、gp_mae_random.npy、random-mae.dat、entropy-mae.dat、gp_mean.npy、ytest.npy
文件格式：NPY、DAT
字段映射介绍：记录熵采样与随机采样主动学习过程的MAE结果、模型在测试集的均值、真实标签等统计数据
潜空间数据文件
文件名称：latent_test.npy、yvals_latent.npy
文件格式：NPY
字段映射介绍：2D潜空间向量及对应的形成能数据
可视化与分析代码文件
文件名称：active-learning-new.ipynb、uncertainty-quantification.ipynb、visualise-latent-space.ipynb
文件格式：IPYNB
字段映射介绍：包含数据可视化、不确定性量化分析的代码
实验压缩包
文件名称：paper-experiments.tgz
文件格式：TGZ
字段映射介绍：复现论文实验所需的压缩文件

数据来源

GitHub仓库https://github.com/keeeto/gp-net

适用场景

材料性能预测模型复现: 用于复现基于熵的图神经网络主动学习预测材料性能的实验结果
主动学习算法评估: 对比熵采样与随机采样在材料性能预测任务中的主动学习效果
材料潜空间分析: 利用潜空间向量数据研究材料结构与性能的关联
模型不确定性量化: 通过不确定性分析代码评估材料性能预测模型的可靠性
材料科学机器学习研究: 为材料领域图神经网络与主动学习结合的研究提供数据支撑

数据与资源

4922828.zipZIP
211.82 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	211.82 MiB
最后更新	2026年1月21日
创建于	2026年1月21日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。