数据集概述
本数据集为IMP-MARL多智能体强化学习实验数据集,包含三种环境(struct_uc、struct_c、owf)下七种MARL方法的实验日志、最优智能体网络权重及启发式策略日志。数据支持多智能体强化学习算法性能评估与对比分析,共包含四个文件,以压缩包和文档为主。
文件详解
- MARL_logs.zip
- 文件格式:ZIP
- 内容说明:包含所有MARL方法的配置、执行及结果文件,按IMP-MARL环境分类存储;每个环境下含各方法的测试与训练文件,包括控制台输出(cout.txt)、实验参数(config.json)、奖励值等日志(info.json)、硬件信息(run.json)
- best_agent_networks.zip
- 文件格式:ZIP
- 内容说明:存储最优MARL策略的控制器网络权重,每个方法/环境对应一个PyTorch文件(agent.th)
- heur_logs.zip
- 文件格式:ZIP
- 内容说明:包含专家启发式策略的配置、执行及结果文件;/heur_search目录下存储所有评估启发式策略的numpy格式日志,以及最优启发式策略在一万次实现中的pickle格式结果
- readme.txt
- 文件格式:TXT
- 内容说明:数据集说明文档,包含作者、GitHub仓库链接、环境类型及实验内容概述
数据来源
GitHub仓库:https://github.com/moratodpg/imp_marl
适用场景
- 多智能体强化学习算法性能评估:对比QMIX、QVMIX等七种MARL方法在不同环境下的奖励值、收敛速度等指标
- 强化学习策略优化研究:基于最优控制器网络权重(agent.th)分析高性能MARL策略的特征与泛化能力
- 启发式与强化学习策略对比:通过heur_logs.zip与MARL_logs.zip的结果对比,探究两种策略在复杂系统中的表现差异
- 多智能体系统环境适配分析:研究k-out-of-n系统、海上风电场等环境对MARL算法性能的影响机制