English(EN) LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory

LoGeR模型支持混合内存的长上下文几何重建

作者 PulseAugur 编辑部 · [1 个来源] · 2026-04-28 04:00

研究人员推出了一种名为LoGeR的新型架构，专为视频中的长上下文几何重建而设计。该系统通过分块处理视频流并采用混合内存模块来克服现有前馈模型的局限性。该模块结合了用于全局帧锚定的参数化测试时训练内存和用于精确对齐的非参数化滑动窗口注意力，从而能够对数千帧进行稳健的重建。 AI

影响能够在前所未有的视频视野范围内实现稳健、全局一致的3D重建，有望改进机器人和自主系统中的应用。

排序理由这是一篇详细介绍几何重建新模型架构的研究论文。

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Junyi Zhang, Charles Herrmann, Junhwa Hur, Chen Sun, Ming-Hsuan Yang, Forrester Cole, Trevor Darrell, Deqing Sun · 2026-04-28 04:00

LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory

arXiv:2603.03269v2 Announce Type: replace Abstract: Feedforward geometric foundation models achieve strong short-window reconstruction, yet scaling them to minutes-long videos is bottlenecked by quadratic attention complexity or limited effective memory in recurrent designs. We p…