研究人员推出了 Safe2Drive (S2D),一个旨在评估端到端自动驾驶模型安全性的新基准。S2D 包含 100 个挑战性场景,例如施工区域和行人违规穿越马路,并引入了 SafeDriving Score (SDS) 来衡量安全关键行为。在 S2D 上进行测试时,两个领先模型 LEAD 和 SimLingo 的驾驶得分与它们在现有基准上的表现相比显著降低,表明其安全驾驶能力脆弱且缺乏鲁棒的行为推理。 AI
影响 凸显了当前端到端自动驾驶模型在安全方面存在的关键差距,有必要对鲁棒的行为推理进行进一步研究。
排序理由 该集群包含一篇研究论文,该论文为自动驾驶模型引入了新的基准和评估指标。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →