找到59个数据集

标签: 强化学习

过滤结果
  • 强化学习数据集RLDataset-mahmoudabdellahy

    2025年4月25日   

    强化学习数据集RLDataset-mahmoudabdellahy 数据来源:互联网公开数据 标签:强化学习,数据集,智能体,环境,策略,奖励,机器学习,人工智能 数据概述: 该数据集包含来自各种强化学习环境的交互数据,记录了智能体与环境交互的经验。主要特征如下: 时间跨度:数据记录的时间范围涵盖了各种强化学习实验,时间跨度取决于具体实验。...
    packageimg
  • 戴维-金应用人工智能作业1连珠游戏数据集DavidKingAppliedAIAssignment1Connect-4LevelDataset-davidk...

    2025年4月24日   

    戴维-金应用人工智能作业1连珠游戏数据集DavidKingAppliedAIAssignment1Connect-4LevelDataset-davidkingrutgers 数据来源:互联网公开数据 标签:人工智能,连珠游戏,数据集,游戏AI,机器学习,深度学习,强化学习,算法研究 数据概述:...
    packageimg
  • 强化学习模型在黄金交易应用数据集强化学习模型在黄金交易应用数据集-benezzineissam

    2025年4月24日   

    强化学习模型在黄金交易应用数据集强化学习模型在黄金交易应用数据集-benezzineissam 数据来源:互联网公开数据 标签:强化学习,黄金交易,数据集,金融分析,机器学习,时间序列,经济预测,交易策略 数据概述:该数据集用于研究强化学习模型在黄金交易中的应用,记录了黄金价格的历史数据,适用于交易策略优化和市场预测等任务。主要特征如下:...
    packageimg
  • 强化学习多智能体协同任务训练数据集QMIXTrainDataVersion1-ouyutao

    2025年4月24日   

    强化学习多智能体协同任务训练数据集QMIXTrainDataVersion1-ouyutao 数据来源:互联网公开数据 标签:强化学习,多智能体系统,协同任务,训练数据,机器学习,智能控制,算法研究,仿真模拟 数据概述: 该数据集是QMIX算法的训练数据版本1,包含多智能体系统在协同任务中的训练数据,适用于强化学习算法的研究与应用。主要特征如下:...
    packageimg
  • 强化学习训练数据数据集-vishwashsharma

    2025年4月24日   

    强化学习训练数据数据集-vishwashsharma 数据来源:互联网公开数据 标签:强化学习,数据集,智能体,环境交互,策略优化,算法训练,机器学习,人工智能 数据概述:该数据集包含用于强化学习算法训练的各种智能体与环境交互的数据记录。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于数据集的创建时间,可能涵盖不同时间段。...
    packageimg
  • 强化学习环境主题数据集-wouterknibbe

    2025年4月24日   

    强化学习环境主题数据集-wouterknibbe 数据来源:互联网公开数据 标签:强化学习,数据集,环境,主题,人工智能,机器学习,策略,奖励 数据概述: 该数据集包含了多个强化学习环境,旨在探索不同主题在强化学习中的应用。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于各个环境的设计和运行情况。...
    packageimg
  • 蒙特卡洛树搜索训练样本数据集MCTSTrainingSampleDataset-roberthatch

    2025年4月24日   

    蒙特卡洛树搜索训练样本数据集MCTSTrainingSampleDataset-roberthatch 数据来源:互联网公开数据 标签:蒙特卡洛树搜索,强化学习,数据集,博弈,人工智能,决策优化,游戏AI,训练样本 数据概述:...
    packageimg
  • 月球着陆器v2强化学习环境数据集-2023年-jaypradipshah

    2025年4月23日   

    月球着陆器v2强化学习环境数据集-2023年-jaypradipshah 数据来源:互联网公开数据 标签:OpenAI Gym,月球着陆器,强化学习,模拟环境,数据集,动作空间,奖励机制,观测数据 数据概述: 本数据集包含使用OpenAI Gym环境“LunarLander-v2”生成的4000个月球着陆器模拟降落任务的数据。数据集模拟了“Lunar...
    packageimg
  • 强化学习与人类反馈数据RLHF数据集-devanshumahapatra

    2025年4月23日   

    强化学习与人类反馈数据RLHF数据集-devanshumahapatra 数据来源:互联网公开数据 标签:强化学习,人类反馈,数据集,自然语言处理,文本生成,模型训练,人工智能,语言模型 数据概述: 该数据集包含了用于强化学习与人类反馈(RLHF)技术的数据,主要用于训练语言模型,使其生成更符合人类偏好的文本。主要特征如下:...
    packageimg
  • 黄金价格强化学习数据集XAUUSD-aryasiregar

    2025年4月22日   

    黄金价格强化学习数据集XAUUSD-aryasiregar 数据来源:互联网公开数据 标签:黄金价格,强化学习,金融市场,时间序列,交易策略,量化交易,数据集,货币对 数据概述: 该数据集包含黄金/美元(XAUUSD)交易对的历史价格数据,专为强化学习算法的训练和测试而设计。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 蒙特卡洛树搜索MCTS变体游戏力数据集-keyladiazv

    2025年4月22日   

    蒙特卡洛树搜索MCTS变体游戏力数据集-keyladiazv 数据来源:互联网公开数据 标签:蒙特卡洛树搜索,MCTS,游戏力,强化学习,人工智能,算法,数据集,策略评估 数据概述: 该数据集包含关于蒙特卡洛树搜索(MCTS)及其变体在游戏中的表现数据。主要特征如下: 时间跨度: 数据记录的时间范围为数据集的创建和更新周期。 地理范围:...
    packageimg
  • MCTS算法竞赛冠军额外训练数据集-jsday96

    2025年4月22日   

    MCTS算法竞赛冠军额外训练数据集-jsday96 数据来源:互联网公开数据 标签:MCTS, 强化学习, 算法竞赛, 游戏AI, 训练数据, 数据集 数据概述: 本数据集包含了MCTS(蒙特卡洛树搜索)算法竞赛冠军方案所使用的额外训练数据。这些数据主要用于提升MCTS算法在复杂游戏环境中的表现。数据集的核心组成部分包括:...
    packageimg
  • 电动汽车充电数据集

    2025年4月21日   

    电动汽车充电数据集 数据来源:互联网公开数据 标签:电动汽车,充电行为,时序数据,能源消耗,机器学习,强化学习,充电模式,负载分析 数据概述:...
    packageimg
  • 下一代人工智能传感器高级信号处理数据集-2024年-emirhanai

    2025年4月21日   

    下一代人工智能传感器高级信号处理数据集-2024年-emirhanai 数据来源:互联网公开数据 标签:人工智能传感器,信号处理,国防,数据集,机器学习,深度学习,强化学习,自主系统 数据概述: 本数据集包含由下一代人工智能传感器生成的高级信号处理数据,专为国防行业设计。数据集由Emirhan...
    packageimg
  • 动态治疗方案强化学习基准数据集

    2025年4月19日   

    动态治疗方案强化学习基准数据集 数据来源:互联网公开数据 标签:强化学习,动态治疗方案,超参数优化,测试结果,基准平台,医疗AI,机器学习评估 数据概述: 本数据集来源于DTR-bench,是一个用于强化学习(Reinforcement Learning,...
    packageimg
  • 帮助与无害智能助手数据集

    2025年4月15日   

    帮助与无害智能助手数据集 数据来源:互联网公开数据 标签:智能助手,人机交互,强化学习,对话系统,行为分析,风险控制,人机反馈 数据概述: 本数据集包含来自Anthropic论文《Training a Helpful and Harmless Assistant with Reinforcement Learning from Human...
    packageimg
  • Kaggle-ConnectX决赛智能体对局数据集2023

    2025年4月15日   

    Kaggle-ConnectX决赛智能体对局数据集2023 数据来源:互联网公开数据 本数据集来自 Kaggle 平台举办的 ConnectX 强化学习竞赛,收集了公开排行榜(Public Leaderboard)前 50 名智能体在比赛中进行的对局信息。原始对局以 JSON 格式保存,同时提取了所有对局中的动作与状态,共包含: 6367...
    packageimg
  • 数据6G车联网动态网络切片与资源分配数据集1963-2021

    2025年4月15日   

    数据6G车联网动态网络切片与资源分配数据集1963-2021 数据来源:互联网公开数据 标签:6G网络,车联网,动态网络切片,资源分配,强化学习,边缘计算,物联网 数据概述:...
    packageimg
  • 大型语言模型LLM科学考试RLHF训练数据集

    2025年4月15日   

    大型语言模型LLM科学考试RLHF训练数据集 数据来源:互联网公开数据 标签:LLM, 科学考试, RLHF, 奖励模型训练, 强化学习, 自然语言处理, 机器学习 数据概述: 本数据集是使用Llama-2-13b模型生成的,专门用于奖励模型(RM, Reward Model)训练,进而应用于强化学习与人类反馈(RLHF, Reinforcement...
    packageimg