数据集概述
本数据集包含复现论文“Entropy based active learning of graph neural networks for materials properties”所需的全部数据与模型文件,包括训练数据、训练好的Megnet模型参数、主动学习结果、潜空间向量及可视化代码等,支持材料性能预测实验的复现与分析,共含18个文件。
文件详解
- 训练数据文件
- 文件名称:formation_energy_per_atom_data.pkl
- 文件格式:PKL
- 字段映射介绍:来自Materials Project的训练数据,用于材料性能预测模型的训练
- 模型参数文件
- 文件名称:fitted_formation_energy_per_atom_model.hdf5、fitted_formation_energy_per_atom_model.hdf5.json
- 文件格式:HDF5、JSON
- 字段映射介绍:保存的Megnet模型训练参数,JSON文件包含graph_converter、target_scaler、metadata等元数据
- 主动学习结果文件
- 文件名称:gp_mae_entropy.npy、gp_mae_random.npy、random-mae.dat、entropy-mae.dat、gp_mean.npy、ytest.npy
- 文件格式:NPY、DAT
- 字段映射介绍:记录熵采样与随机采样主动学习过程的MAE结果、模型在测试集的均值、真实标签等统计数据
- 潜空间数据文件
- 文件名称:latent_test.npy、yvals_latent.npy
- 文件格式:NPY
- 字段映射介绍:2D潜空间向量及对应的形成能数据
- 可视化与分析代码文件
- 文件名称:active-learning-new.ipynb、uncertainty-quantification.ipynb、visualise-latent-space.ipynb
- 文件格式:IPYNB
- 字段映射介绍:包含数据可视化、不确定性量化分析的代码
- 实验压缩包
- 文件名称:paper-experiments.tgz
- 文件格式:TGZ
- 字段映射介绍:复现论文实验所需的压缩文件
数据来源
GitHub仓库https://github.com/keeeto/gp-net
适用场景
- 材料性能预测模型复现: 用于复现基于熵的图神经网络主动学习预测材料性能的实验结果
- 主动学习算法评估: 对比熵采样与随机采样在材料性能预测任务中的主动学习效果
- 材料潜空间分析: 利用潜空间向量数据研究材料结构与性能的关联
- 模型不确定性量化: 通过不确定性分析代码评估材料性能预测模型的可靠性
- 材料科学机器学习研究: 为材料领域图神经网络与主动学习结合的研究提供数据支撑