English(EN) Spatial-Aware Reduction Framework: Towards Efficient and Faithful Visual State Space Models

新的STORM框架通过在令牌缩减过程中保留空间结构来增强Mamba模型

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-18 08:31

研究人员开发了STORM，一种新颖的空间感知令牌缩减框架，旨在解决Mamba等视觉状态空间模型在进行令牌压缩时出现的性能下降问题。现有的缩减方法在空间上是不敏感的，会破坏这些模型至关重要的二维结构。STORM将缩减重新构建为对空间单元的结构化操作，在无需额外训练的情况下保留了网格拓扑和邻域连贯性。这个即插即用的模块显著提高了准确性恢复能力，尤其是在VMamba上实现了高达63.3%的提升，在PlainMamba上仅下降1.0%，使其性能与ViT相当。 AI

影响提高了视觉状态空间模型的效率和准确性，有望改善计算机视觉任务的性能。

排序理由该集群包含一篇详细介绍改进现有模型的新框架的学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Jindi Lv, Aoyu Li, Yuhao Zhou, Zheng Zhu, Xiaofeng Wang, Qing Ye, Yueqi Duan, Wentao Feng, Jiancheng Lv · 2026-06-19 04:00

Spatial-Aware Reduction Framework: Towards Efficient and Faithful Visual State Space Models

arXiv:2606.19932v1 Announce Type: cross Abstract: Mamba demonstrates strong efficiency in modeling long visual sequences. However, when token reduction is applied to structurally enhanced Mamba variants, these models exhibit a severe performance collapse. We attribute this degrad…
arXiv cs.AI TIER_1 English(EN) · Jiancheng Lv · 2026-06-18 08:31

空间感知缩减框架：迈向高效且忠实的视觉状态空间模型

Mamba demonstrates strong efficiency in modeling long visual sequences. However, when token reduction is applied to structurally enhanced Mamba variants, these models exhibit a severe performance collapse. We attribute this degradation to the spatially agnostic nature of existing…

报道来源 [2]

Spatial-Aware Reduction Framework: Towards Efficient and Faithful Visual State Space Models

空间感知缩减框架：迈向高效且忠实的视觉状态空间模型

相关实体

相关话题