实体
Stationary Robust Mean-Field Games under Model Mismatches
Stationary Robust Mean-Field Games under Model Mismatches
PulseAugur coverage of Stationary Robust Mean-Field Games under Model Mismatches — every cluster mentioning Stationary Robust Mean-Field Games under Model Mismatches across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新框架应对多智能体强化学习中的模型不匹配问题
研究人员开发了一个新的固定鲁棒均值场博弈框架,以应对在实际场景中部署多智能体强化学习(MARL)所面临的挑战。该框架解决了训练模拟器与实际环境之间的模型不匹配问题,这可能导致性能下降。它通过在不确定集内针对最坏情况的转移模型优化策略来引入分布鲁棒性,为缓解这些问题提供了一种原则性的方法。该论文建立了一个鲁棒动态规划原理,并证明了固定鲁棒均值场均衡的存在性,同时提供了一个具体的算法和收敛性保证。
-
新研究探索鲁棒优化和强化学习技术 · 已追踪 6 个来源
几篇新研究论文探索了强化学习和优化中的先进技术,重点关注鲁棒性和生成模型。其中一篇论文引入了一个平稳鲁棒均值场博弈框架,以解决多智能体强化学习中的模型不匹配问题,并建立了具有收敛保证的新算法。另一篇论文提出了生成式鲁棒优化 (GRO),它使用深度生成模型来定义不确定性集,以实现更具表现力和可处理性的优化。此外,还提出了一种名为 SIVE 的新估计器,用于绕过神经网络损失景观中的最小化偏差,提供了一种鲁棒的训练诊断工具。最后,引入了一种…