数据集 - 海数据

自动控制与机器人技术数据集A2CFetchReachDenseDataset-matiasehrsam

2025年4月25日

自动控制与机器人技术数据集A2CFetchReachDenseDataset-matiasehrsam 数据来源：互联网公开数据标签：机器人技术，自动控制，数据集，深度学习，强化学习，机器人操作，任务规划，人工智能数据概述：该数据集来源于自动控制与机器人技术领域，专注于机器人抓取与操作任务的模拟数据。主要特征如下：...

ZIP

强化学习数据集RLDataset-mahmoudabdellahy

2025年4月25日

强化学习数据集RLDataset-mahmoudabdellahy 数据来源：互联网公开数据标签：强化学习，数据集，智能体，环境，策略，奖励，机器学习，人工智能数据概述：该数据集包含来自各种强化学习环境的交互数据，记录了智能体与环境交互的经验。主要特征如下：时间跨度：数据记录的时间范围涵盖了各种强化学习实验，时间跨度取决于具体实验。...

ZIP

戴维-金应用人工智能作业1连珠游戏数据集DavidKingAppliedAIAssignment1Connect-4LevelDataset-davidk...

2025年4月24日

戴维-金应用人工智能作业1连珠游戏数据集DavidKingAppliedAIAssignment1Connect-4LevelDataset-davidkingrutgers 数据来源：互联网公开数据标签：人工智能，连珠游戏，数据集，游戏AI，机器学习，深度学习，强化学习，算法研究数据概述：...

ZIP

强化学习模型在黄金交易应用数据集强化学习模型在黄金交易应用数据集-benezzineissam

2025年4月24日

强化学习模型在黄金交易应用数据集强化学习模型在黄金交易应用数据集-benezzineissam 数据来源：互联网公开数据标签：强化学习，黄金交易，数据集，金融分析，机器学习，时间序列，经济预测，交易策略数据概述：该数据集用于研究强化学习模型在黄金交易中的应用，记录了黄金价格的历史数据，适用于交易策略优化和市场预测等任务。主要特征如下：...

ZIP

强化学习多智能体协同任务训练数据集QMIXTrainDataVersion1-ouyutao

2025年4月24日

强化学习多智能体协同任务训练数据集QMIXTrainDataVersion1-ouyutao 数据来源：互联网公开数据标签：强化学习，多智能体系统，协同任务，训练数据，机器学习，智能控制，算法研究，仿真模拟数据概述：该数据集是QMIX算法的训练数据版本1，包含多智能体系统在协同任务中的训练数据，适用于强化学习算法的研究与应用。主要特征如下：...

ZIP

强化学习训练数据数据集-vishwashsharma

2025年4月24日

强化学习训练数据数据集-vishwashsharma 数据来源：互联网公开数据标签：强化学习，数据集，智能体，环境交互，策略优化，算法训练，机器学习，人工智能数据概述：该数据集包含用于强化学习算法训练的各种智能体与环境交互的数据记录。主要特征如下：时间跨度：数据记录的时间范围不固定，取决于数据集的创建时间，可能涵盖不同时间段。...

ZIP

强化学习环境主题数据集-wouterknibbe

2025年4月24日

强化学习环境主题数据集-wouterknibbe 数据来源：互联网公开数据标签：强化学习，数据集，环境，主题，人工智能，机器学习，策略，奖励数据概述：该数据集包含了多个强化学习环境，旨在探索不同主题在强化学习中的应用。主要特征如下：时间跨度：数据记录的时间跨度不定，取决于各个环境的设计和运行情况。...

ZIP

蒙特卡洛树搜索训练样本数据集MCTSTrainingSampleDataset-roberthatch

2025年4月24日

蒙特卡洛树搜索训练样本数据集MCTSTrainingSampleDataset-roberthatch 数据来源：互联网公开数据标签：蒙特卡洛树搜索，强化学习，数据集，博弈，人工智能，决策优化，游戏AI，训练样本数据概述：...

ZIP

月球着陆器v2强化学习环境数据集-2023年-jaypradipshah

2025年4月23日

月球着陆器v2强化学习环境数据集-2023年-jaypradipshah 数据来源：互联网公开数据标签：OpenAI Gym,月球着陆器,强化学习,模拟环境,数据集,动作空间,奖励机制,观测数据数据概述：本数据集包含使用OpenAI Gym环境“LunarLander-v2”生成的4000个月球着陆器模拟降落任务的数据。数据集模拟了“Lunar...

ZIP

强化学习与人类反馈数据RLHF数据集-devanshumahapatra

2025年4月23日

强化学习与人类反馈数据RLHF数据集-devanshumahapatra 数据来源：互联网公开数据标签：强化学习，人类反馈，数据集，自然语言处理，文本生成，模型训练，人工智能，语言模型数据概述：该数据集包含了用于强化学习与人类反馈（RLHF）技术的数据，主要用于训练语言模型，使其生成更符合人类偏好的文本。主要特征如下：...

ZIP

黄金价格强化学习数据集XAUUSD-aryasiregar

2025年4月22日

黄金价格强化学习数据集XAUUSD-aryasiregar 数据来源：互联网公开数据标签：黄金价格，强化学习，金融市场，时间序列，交易策略，量化交易，数据集，货币对数据概述：该数据集包含黄金/美元（XAUUSD）交易对的历史价格数据，专为强化学习算法的训练和测试而设计。主要特征如下：时间跨度：数据记录的时间范围从2010年至今。...

ZIP

蒙特卡洛树搜索MCTS变体游戏力数据集-keyladiazv

2025年4月22日

蒙特卡洛树搜索MCTS变体游戏力数据集-keyladiazv 数据来源：互联网公开数据标签：蒙特卡洛树搜索，MCTS，游戏力，强化学习，人工智能，算法，数据集，策略评估数据概述：该数据集包含关于蒙特卡洛树搜索（MCTS）及其变体在游戏中的表现数据。主要特征如下：时间跨度：数据记录的时间范围为数据集的创建和更新周期。地理范围：...

ZIP

MCTS算法竞赛冠军额外训练数据集-jsday96

2025年4月22日

MCTS算法竞赛冠军额外训练数据集-jsday96 数据来源：互联网公开数据标签：MCTS, 强化学习, 算法竞赛, 游戏AI, 训练数据, 数据集数据概述：本数据集包含了MCTS（蒙特卡洛树搜索）算法竞赛冠军方案所使用的额外训练数据。这些数据主要用于提升MCTS算法在复杂游戏环境中的表现。数据集的核心组成部分包括：...

ZIP

电动汽车充电数据集

2025年4月21日

电动汽车充电数据集数据来源：互联网公开数据标签：电动汽车,充电行为,时序数据,能源消耗,机器学习,强化学习,充电模式,负载分析数据概述：...

ZIP

下一代人工智能传感器高级信号处理数据集-2024年-emirhanai

2025年4月21日

下一代人工智能传感器高级信号处理数据集-2024年-emirhanai 数据来源：互联网公开数据标签：人工智能传感器,信号处理,国防,数据集,机器学习,深度学习,强化学习,自主系统数据概述：本数据集包含由下一代人工智能传感器生成的高级信号处理数据，专为国防行业设计。数据集由Emirhan...

ZIP

动态治疗方案强化学习基准数据集

2025年4月19日

动态治疗方案强化学习基准数据集数据来源：互联网公开数据标签：强化学习,动态治疗方案,超参数优化,测试结果,基准平台,医疗AI,机器学习评估数据概述：本数据集来源于DTR-bench，是一个用于强化学习（Reinforcement Learning,...

ZIP

帮助与无害智能助手数据集

2025年4月15日

帮助与无害智能助手数据集数据来源：互联网公开数据标签：智能助手,人机交互,强化学习,对话系统,行为分析,风险控制,人机反馈数据概述：本数据集包含来自Anthropic论文《Training a Helpful and Harmless Assistant with Reinforcement Learning from Human...

ZIP

Kaggle-ConnectX决赛智能体对局数据集2023

2025年4月15日

Kaggle-ConnectX决赛智能体对局数据集2023 数据来源：互联网公开数据本数据集来自 Kaggle 平台举办的 ConnectX 强化学习竞赛，收集了公开排行榜（Public Leaderboard）前 50 名智能体在比赛中进行的对局信息。原始对局以 JSON 格式保存，同时提取了所有对局中的动作与状态，共包含： 6367...

ZIP

数据6G车联网动态网络切片与资源分配数据集1963-2021

2025年4月15日

数据6G车联网动态网络切片与资源分配数据集1963-2021 数据来源：互联网公开数据标签：6G网络,车联网,动态网络切片,资源分配,强化学习,边缘计算,物联网数据概述：...

ZIP

大型语言模型LLM科学考试RLHF训练数据集

2025年4月15日

大型语言模型LLM科学考试RLHF训练数据集数据来源：互联网公开数据标签：LLM, 科学考试, RLHF, 奖励模型训练, 强化学习, 自然语言处理, 机器学习数据概述：本数据集是使用Llama-2-13b模型生成的，专门用于奖励模型（RM, Reward Model）训练，进而应用于强化学习与人类反馈（RLHF, Reinforcement...

ZIP

找到60个数据集

注册成功！