English(EN) Online Learning for Supervisory Switching Control

新算法将 bandit 方法应用于控制系统

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 04:00

研究人员开发了一种新颖的算法，用于部分可观测线性动力系统中的监督切换控制。这种数据驱动的方法将多臂老虎机算法改编用于控制场景，旨在从候选控制器池中识别并部署正确的控制器。该算法提供有限时间保证，并能在 $O(N \log^2 N)$ 步内识别出合适的控制器，同时实现有限的 $L_2$-增益。 AI

排序理由该集群包含一篇详细介绍新算法的研究论文。[lever_c_demoted from research: ic=1 ai=0.4]

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Haoyuan Sun, Ali Jadbabaie · 2026-06-09 04:00

面向监督切换控制的在线学习

arXiv:2603.14762v3 Announce Type: replace-cross Abstract: We study supervisory switching control for partially-observed linear dynamical systems. The objective is to identify and deploy a suitable controller for the unknown system by periodically selecting among a collection of $…