Fictitious play
PulseAugur coverage of Fictitious play — every cluster mentioning Fictitious play across labs, papers, and developer communities, ranked by signal.
2 天有情绪数据
-
AI算法在游戏中系统性地选择不同的纳什均衡
一篇新的研究论文探讨了不同的算法如何在零和游戏中选择纳什均衡,发现这种选择是依赖于算法的,而不是随机的。像R-NaD和磁镜下降这样的正则化方法倾向于选择最大熵均衡,而像CFR和CFR+这样的后悔平均方法则收敛于一个较低熵的均衡。这种选择对游戏结果有下游影响,尤其是在具有顺序或隐藏信息的游戏中。
-
新算法解决复杂多人博弈中的纳什均衡问题 · 跟踪3 个来源
研究人员开发了一种名为“投影可利用性下降”(Projected Exploitability Descent, PED)的新算法,用于近似计算具有不完美信息的复杂多人博弈中的纳什均衡。该算法最小化了可利用性函数的一个代理目标,这是一个非凸且不光滑的目标。虽然 PED 在长时间运行中表现出持续的改进,但最初的性能不如已有的方法,如虚构博弈(Fictitious Play, FP)和反事实遗憾最小化(Counterfactual Regr…
-
新AI方法应对不完美信息游戏
研究人员正在开发新的方法来应对具有不完美信息(imperfect information)的复杂游戏。一篇论文介绍了循环结构策略梯度(Recurrent Structural Policy Gradient, RSPG),这是一种用于部分可观察平均场博弈(partially observable mean field games)的新颖方法,其收敛速度比现有方法更快。另一项研究重新评估了策略梯度方法,发现像PPO这样更简单的算法可以与…