English(EN) PlatoLTL: Learning to Generalize Across Symbols in LTL Instructions for Multi-Task RL

PlatoLTL使强化学习代理能够泛化到LTL指令中未见的符号

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:00

研究人员引入了PlatoLTL，这是一种旨在提高多任务强化学习泛化能力的新方法。该方法使强化学习代理能够执行在训练期间未遇到的任务，特别是通过在有限时间逻辑（LTL）指令中的不同符号或命题之间进行泛化。PlatoLTL将命题建模为参数化原子谓词，使策略能够学习共享结构并在复杂环境中实现零样本泛化。 AI

影响增强了强化学习代理泛化到未见任务和符号的能力，可能拓宽其在复杂、动态环境中的应用范围。

排序理由这是一篇详细介绍强化学习新方法的学术论文。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Jacques Cloete, Mathias Jackermeier, Ioannis Havoutis, Alessandro Abate · 2026-05-08 04:00

PlatoLTL：在 LTL 指令中学习跨符号泛化以实现多任务 RL

arXiv:2601.22891v2 Announce Type: replace Abstract: A central challenge in multi-task reinforcement learning (RL) is to train generalist policies capable of performing tasks not seen during training. To facilitate such generalization, linear temporal logic (LTL) has emerged as a …

报道来源 [1]

PlatoLTL：在 LTL 指令中学习跨符号泛化以实现多任务 RL

相关实体

相关话题