PulseAugur
实时 13:51:58
实体 Bellman equations

Bellman equations

PulseAugur coverage of Bellman equations — every cluster mentioning Bellman equations across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_16154 ·

    AI 研究人员为时序逻辑策略开发新的值函数

    研究人员开发了一种新的方法,用于在强化学习中构建时序逻辑规范的最优策略。该方法通过分解值函数并创建考虑状态历史的非马尔可夫策略,在现有工作的基础上进行了扩展。Q 函数也被用作复杂时序逻辑任务的安全过滤器,将先前能力扩展到基本的到达和避免场景之外。