PulseAugur
实时 11:27:59
English(EN) Online Learning for Supervisory Switching Control

新算法将 bandit 方法应用于控制系统

研究人员开发了一种新颖的算法,用于部分可观测线性动力系统中的监督切换控制。这种数据驱动的方法将多臂老虎机算法改编用于控制场景,旨在从候选控制器池中识别并部署正确的控制器。该算法提供有限时间保证,并能在 $O(N \log^2 N)$ 步内识别出合适的控制器,同时实现有限的 $L_2$-增益。 AI

排序理由 该集群包含一篇详细介绍新算法的研究论文。[lever_c_demoted from research: ic=1 ai=0.4]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Haoyuan Sun, Ali Jadbabaie ·

    面向监督切换控制的在线学习

    arXiv:2603.14762v3 Announce Type: replace-cross Abstract: We study supervisory switching control for partially-observed linear dynamical systems. The objective is to identify and deploy a suitable controller for the unknown system by periodically selecting among a collection of $…