研究人员开发了Realtime-VLA FLASH,一个旨在加速基于扩散的视觉-语言-动作模型(dVLAs)在具身智能任务中的应用的新框架。该系统使用一个轻量级的草稿模型进行推测性推理,显著减少了在重新规划过程中对完整、较慢的推理调用的需求。这种方法在LIBERO基准测试上实现了3.04倍的加速,将平均推理延迟降低到19.1毫秒,同时保持了任务性能,并在传送带分拣等实际应用中显示出潜力。 AI
影响 通过显著降低推理延迟,加速具身AI的实时应用。
排序理由 该集群包含一篇详细介绍新AI模型框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →