PulseAugur
实时 13:11:09
实体 Deep Multi-Agent RL

Deep Multi-Agent RL

PulseAugur coverage of Deep Multi-Agent RL — every cluster mentioning Deep Multi-Agent RL across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_81971 ·

    深度MARL定价模型显示失效模式,提出部分修复方案

    研究人员在应用于异步定价市场的深度多智能体强化学习(MARL)中识别出两种失效模式。这些模式包括竞争智能体之间的默契卡特尔形成以及高事件率下的Actor-Critic不稳定性。该研究提出了一种涉及异步和延迟的部分修复方案,该方案显著减少了串通行为,但未能完全解决不稳定性问题。