English(EN) Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling

新框架使用大语言模型实现更安全的自动驾驶轨迹

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了Plan-R1，一种利用大语言模型进行自动驾驶轨迹规划的新型两阶段框架。该方法首先在专家数据上预训练一个通用轨迹预测器以学习类人行为，然后使用基于规则的奖励进行微调，以确保安全性和合规性。一项关键创新是方差解耦GRPO（Variance-Decoupled GRPO），它解决了现有优化方法的局限性，确保在训练过程中优先考虑安全关键目标。在nuPlan基准上的实验表明，Plan-R1在现实的反应式场景中取得了最先进的性能。 AI

影响增强了自动驾驶的安全性和可行性，可能加速其在现实世界中的部署。

排序理由该集群包含一篇研究论文，详细介绍了自动驾驶轨迹规划的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Xiaolong Tang, Meina Kan, Shiguang Shan, Xilin Chen · 2026-06-02 04:00

Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling

arXiv:2505.17659v4 Announce Type: replace-cross Abstract: Safe and feasible trajectory planning is critical for real-world autonomous driving systems. However, existing learning-based planners rely heavily on expert demonstrations, which not only lack explicit safety awareness bu…

报道来源 [1]

Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling

相关实体

相关话题