一项新研究对用于测试自动驾驶汽车的强化学习技术进行了实证评估,特别比较了单目标强化学习(SORL)和多目标强化学习(MORL)在生成关键场景方面的表现。研究表明,虽然两种方法都能发现需求违反,但MORL倾向于产生更多样化的场景,而SORL可能暴露更严重的问题。MORL和SORL之间的选择取决于优先考虑场景多样性还是违规的严重性,MORL更适合广泛的覆盖范围。 AI
影响 为优化自动驾驶汽车等复杂AI系统的测试策略提供了见解。
排序理由 学术论文,比较了两种强化学习方法在特定应用中的表现。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →