English(EN) Imagine to Ensure Safety in Hierarchical Reinforcement Learning

新方法增强了分层强化学习任务的安全性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-21 14:04

研究人员开发了一种新颖的方法来增强分层强化学习的安全性，特别是在复杂、长时限的任务中。该方法利用学习到的世界模型，结合用于生成子目标的高层策略和采用想象性回滚来防止不安全行为的低层策略。与具有挑战性的导航和操作任务上现有的安全强化学习基线相比，该技术显著提高了成功率并确保了一致的约束满足。 AI

影响这项研究可能导致在需要长期规划和遵守安全协议的复杂现实场景中，AI代理更加可靠和安全。

排序理由详细介绍强化学习新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Aleksandr I. Panov · 2026-06-21 14:04

设想在分层强化学习中确保安全

This work investigates the safe exploration problem in reinforcement learning, where an agent must maximize cumulative performance while simultaneously satisfying safety constraints. This challenge becomes even more pronounced in long-horizon tasks, where existing safe methods fa…