PulseAugur
实时 17:43:52
实体 DeepNash

DeepNash

PulseAugur coverage of DeepNash — every cluster mentioning DeepNash across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_105033 ·

    新GARIP方法增强零和博弈中自博弈的收敛性

    研究人员推出了一种新颖的用于改进双人零和博弈中自博弈的方法,名为GARIP。与使用固定或定期更新参考的方法不同,GARIP利用过去策略的运行平均值。该方法在理论上被证明可以最小化参考值的峰值滞后,从而实现更稳定的收敛。在包括矩阵博弈以及Connect Four和Othello等棋盘博弈在内的各种博弈上的实验表明,GARIP在鲁棒性和默认超参数设置方面,表现与现有方法相当或更优。