研究人员开发了VLN-Cache,一个旨在提高视觉和语言导航(VLN)模型效率的新框架。该方法通过重用稳定的视觉令牌,解决了实时应用中冗余计算的挑战。VLN-Cache 结合了视图对齐重映射来处理相机视角的改变,以及任务相关性过滤器来管理导航过程中语义焦点的转移。在 R2R-CE 基准测试上的实验表明,在保持导航成功率的同时,速度提升高达 1.52 倍。 AI
影响 VLN-Cache通过优化令牌重用,为更快、更高效的实时导航系统提供了潜在途径。
排序理由 这是一篇介绍用于提高VLN模型效率的新框架的研究论文。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →