研究人员开发了PO-PDDL,一种新的符号化部分可观察马尔可夫决策过程(POMDPs)的公式化方法,它在保持PDDL的关系结构的同时,显式地建模了部分可观察性和随机性。该公式化旨在友好于LLM,并可在不同任务中重复使用。提出了一种从机器人执行的视觉演示中学习PO-PDDL模型的流水线,以识别部分可观察性并学习随机模型。在真实世界操作任务上的实验表明,该方法在不确定性下的鲁棒任务规划方面优于现有的PDDL和POMDP学习方法,并降低了规划成本。 AI
排序理由 该集群包含一篇学术论文,详细介绍了用于机器人不确定性规划的新公式化和学习流水线。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →