English(EN) LC-SAC: Lyapunov-Constrained Soft Actor-Critic via Koopman Operator Theory for Trajectory Tracking and Stabilization

新的强化学习算法为物理系统增加了稳定性保证

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

研究人员开发了一种名为LC-SAC的新型强化学习算法，旨在为安全关键型物理系统提供稳定性保证。该算法将Lyapunov稳定性理论与软Actor-Critic方法相结合，利用Koopman算子理论学习系统动力学的线性代理模型。该方法将候选控制Lyapunov函数作为惩罚项纳入Actor更新中，将约束执行重点放在罕见但严重的失稳事件上。 AI

影响增强了强化学习在物理系统中的安全性与可靠性，可能使其在关键应用中得到更广泛的应用。

排序理由这是一篇详细介绍具有稳定性保证的新型强化学习算法的研究论文。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Dhruv S. Kushwaha, Zoleikha A. Biron · 2026-06-03 04:00

LC-SAC：基于库普曼算子理论的李雅普诺夫约束软Actor-Critic用于轨迹跟踪和稳定

arXiv:2602.04132v4 Announce Type: replace-cross Abstract: Reinforcement Learning (RL) has achieved remarkable success in solving complex sequential decision-making problems. However, its application to safety-critical physical systems remains constrained by the lack of stability …

报道来源 [1]

LC-SAC：基于库普曼算子理论的李雅普诺夫约束软Actor-Critic用于轨迹跟踪和稳定

相关实体

相关话题