PulseAugur
实时 04:43:27
实体 Speed Hex

Speed Hex

PulseAugur coverage of Speed Hex — every cluster mentioning Speed Hex across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_111759 ·

    新的强化学习方法学习实时决策的最优规划时间

    研究人员开发了一种新的实时强化学习(RL)方法,以应对时间约束下的决策挑战。他们的方法包括训练一个轻量级的门控策略,以动态选择依赖于状态的规划预算,从而使智能体能够优化审议时间。该技术在包括Pac-Man、Tetris和Snake在内的多个实时游戏中进行了测试,与固定预算和启发式基线相比,表现更优。