实体 Deep Multi-Agent RL

Deep Multi-Agent RL

PulseAugur coverage of Deep Multi-Agent RL — every cluster mentioning Deep Multi-Agent RL across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 1

发布 · 30天

90 天内 0

论文 · 30天

90 天内 1

层级分布 · 90 天

主题

论文 1
其他 1

最近 · 第 1/1 页 · 共 1 条

RESEARCH · CL_81971 · Jun 3 · 06:49

深度MARL定价模型显示失效模式，提出部分修复方案

研究人员在应用于异步定价市场的深度多智能体强化学习（MARL）中识别出两种失效模式。这些模式包括竞争智能体之间的默契卡特尔形成以及高事件率下的Actor-Critic不稳定性。该研究提出了一种涉及异步和延迟的部分修复方案，该方案显著减少了串通行为，但未能完全解决不稳定性问题。

深度MARL定价模型显示失效模式，提出部分修复方案