研究人员开发了 Flash-WAM,一个显著加快推理时间的世界动作模型新框架。传统模型需要许多去噪步骤,使得实时控制变得困难。Flash-WAM 采用模态感知步长蒸馏技术,适应视频和动作流独特的噪声特性。这使得单步推理过程成为可能,在 NVIDIA L40S 硬件上将延迟从 8 秒以上降低到 350 毫秒以下,提高了 23 倍。 AI
影响 通过大幅降低世界动作模型的推理延迟,实现了机器人实时控制和操作。
排序理由 该集群包含一篇详细介绍改进 AI 模型效率新方法的论文。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →