研究人员开发了一种新颖的元学习框架,用于设计不确定非线性系统的最优控制器,尤其是在目标系统数据稀缺的情况下。该方法利用来自类似源系统的离线数据,在在线自适应阶段加速训练并提高控制性能。该框架被构建为一个双层优化问题,并且可以集成各种学习算法,包括神经状态空间模型和深度Q网络,在模拟和硬件实验中均显示出优于基线方法的性能。 AI
影响 这项研究有望在数据有限的情况下实现更高效、更有效的控制系统,可能对机器人和自主系统产生影响。
排序理由 该集群包含一篇详细介绍新研究方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →