IMP_MARL_Based多智能体强化学习环境实验数据集

数据集概述

本数据集为IMP-MARL多智能体强化学习实验数据集,包含三种环境(struct_uc、struct_c、owf)下七种MARL方法的实验日志、最优智能体网络权重及启发式策略日志。数据支持多智能体强化学习算法性能评估与对比分析,共包含四个文件,以压缩包和文档为主。

文件详解

  • MARL_logs.zip
  • 文件格式:ZIP
  • 内容说明:包含所有MARL方法的配置、执行及结果文件,按IMP-MARL环境分类存储;每个环境下含各方法的测试与训练文件,包括控制台输出(cout.txt)、实验参数(config.json)、奖励值等日志(info.json)、硬件信息(run.json)
  • best_agent_networks.zip
  • 文件格式:ZIP
  • 内容说明:存储最优MARL策略的控制器网络权重,每个方法/环境对应一个PyTorch文件(agent.th)
  • heur_logs.zip
  • 文件格式:ZIP
  • 内容说明:包含专家启发式策略的配置、执行及结果文件;/heur_search目录下存储所有评估启发式策略的numpy格式日志,以及最优启发式策略在一万次实现中的pickle格式结果
  • readme.txt
  • 文件格式:TXT
  • 内容说明:数据集说明文档,包含作者、GitHub仓库链接、环境类型及实验内容概述

数据来源

GitHub仓库:https://github.com/moratodpg/imp_marl

适用场景

  • 多智能体强化学习算法性能评估:对比QMIX、QVMIX等七种MARL方法在不同环境下的奖励值、收敛速度等指标
  • 强化学习策略优化研究:基于最优控制器网络权重(agent.th)分析高性能MARL策略的特征与泛化能力
  • 启发式与强化学习策略对比:通过heur_logs.zip与MARL_logs.zip的结果对比,探究两种策略在复杂系统中的表现差异
  • 多智能体系统环境适配分析:研究k-out-of-n系统、海上风电场等环境对MARL算法性能的影响机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 482.75 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。