研究人员开发了R2D-RL,这是一个新的强化学习环境,旨在弥合RoboCup 2D足球模拟(RCSS2D)平台与现代基于Python的多智能体强化学习(MARL)工作流之间的差距。该环境通过共享内存通信和周期级同步,促进了与RCSS2D和HELIOS玩家客户端的轻松集成。R2D-RL提供了可配置的对手、混合动作空间、动作掩码、奖励塑造和并行执行等功能,支持全场和基于场景的训练。 AI
影响 简化了机器人足球等复杂机器人系统的MARL研究。
排序理由 该集群包含一篇详细介绍多智能体强化学习新环境的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →