PulseAugur
实时 18:23:41
English(EN) Uncertainty-Aware Predictive Safety Filters for Probabilistic Neural Network Dynamics

新的UPSi滤波器通过不确定性量化增强了强化学习的安全性

研究人员开发了面向不确定性的预测安全滤波器(UPSi),这是一种增强强化学习探索过程中安全性的新方法。UPSi将概率集成神经网络与预测安全滤波器相结合,解决了先前方法在可扩展性和不确定性量化方面的局限性。该系统将未来结果表述为可达集合,并包含明确的确定性约束以防止模型被利用,在探索安全性方面显示出显著的改进。 AI

影响 增强了强化学习探索中的安全保证,有可能在复杂环境中实现更强大、更可靠的AI代理。

排序理由 这是一篇详细介绍安全强化学习新方法的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的UPSi滤波器通过不确定性量化增强了强化学习的安全性

报道来源 [2]

  1. arXiv cs.LG TIER_1 English(EN) · Bernd Frauenknecht, Lukas Kesper, Daniel Mayfrank, Henrik Hose, Sebastian Trimpe ·

    Uncertainty-Aware Predictive Safety Filters for Probabilistic Neural Network Dynamics

    arXiv:2604.26836v1 Announce Type: new Abstract: Predictive safety filters (PSFs) leverage model predictive control to enforce constraint satisfaction during deep reinforcement learning (RL) exploration, yet their reliance on first-principles models or Gaussian processes limits sc…

  2. arXiv cs.LG TIER_1 English(EN) · Sebastian Trimpe ·

    Uncertainty-Aware Predictive Safety Filters for Probabilistic Neural Network Dynamics

    Predictive safety filters (PSFs) leverage model predictive control to enforce constraint satisfaction during deep reinforcement learning (RL) exploration, yet their reliance on first-principles models or Gaussian processes limits scalability and broader applicability. Meanwhile, …