PulseAugur
实时 19:50:31
实体 Dyna-style MBRL

Dyna-style MBRL

PulseAugur coverage of Dyna-style MBRL — every cluster mentioning Dyna-style MBRL across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_09868 ·

    新的UPSi滤波器通过不确定性量化增强了强化学习的安全性

    研究人员开发了面向不确定性的预测安全滤波器(UPSi),这是一种增强强化学习探索过程中安全性的新方法。UPSi将概率集成神经网络与预测安全滤波器相结合,解决了先前方法在可扩展性和不确定性量化方面的局限性。该系统将未来结果表述为可达集合,并包含明确的确定性约束以防止模型被利用,在探索安全性方面显示出显著的改进。