研究人员开发了EMAgnet,一种新颖的参数空间指数移动平均(EMA)正则化技术,用于大型游戏的策略梯度自玩。与之前使用均匀分布作为正则化目标的传统方法不同,EMAgnet根据智能体不断演变的策略来调整其目标。这种方法在各种基准测试中表现出更高的性能,实现了更低的被利用性,尤其是在具有严格占优策略的游戏中。 AI
影响 EMAgnet 的自适应正则化可能会提高复杂游戏环境中 AI 智能体的性能,并可能影响游戏理论和强化学习领域的未来研究。
排序理由 该集群包含一篇详细介绍 AI 自玩新方法的学术论文。
在 arXiv cs.MA (Multiagent) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →