PulseAugur
实时 18:12:45

FractalMamba++ 使用希尔伯特曲线跨分辨率扩展视觉模型

研究人员推出了 FractalMamba++,这是一种增强型视觉骨干网络,旨在提高基于 Mamba 的模型在处理高分辨率输入时的性能。这种新架构利用希尔伯特曲线的几何特性对图像块进行序列化,确保更好的空间连续性并减轻长序列中的信息衰减。该系统采用了新颖的分层跳跃连接和分形感知位置编码技术,以保持基于实际空间邻近度的特征交互。 AI

影响 引入了一种新颖的视觉模型架构,提高了在高分辨率输入上的性能,可能影响计算机视觉领域的下游应用。

排序理由 这是一篇详细介绍新模型架构及其实验结果的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

FractalMamba++ 使用希尔伯特曲线跨分辨率扩展视觉模型

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Bo Li, Haoke Xiao, Lv Tang ·

    FractalMamba++: Scaling Vision Mamba Across Resolutions via Hilbert Fractal Geometr

    arXiv:2505.14062v3 Announce Type: replace Abstract: Vision Mamba offers linear complexity for long visual sequences, yet its performance depends critically on how a two-dimensional patch grid is serialized into a one-dimensional state-space recurrence. Raster-style scans disrupt …