PulseAugur
实时 08:58:12
English(EN) DeepMine-Mamba: Mitigating Information Dilution in Mamba-Based State Space Models for Document Image Binarization

DeepMine-Mamba框架利用Mamba模型增强文档二值化效果

研究人员推出了一种用于文档图像二值化的新框架DeepMine-Mamba,该框架利用了基于Mamba的状态空间模型。所提出的方法解决了直接状态空间传播中固有的信息稀释问题,特别是对于模糊或断裂的文本笔画。引入了一种新颖的抗稀释门控机制,可以选择性地恢复对笔画细节敏感的局部响应,同时减轻背景增强,从而在DIBCO/H-DIBCO基准测试中取得了有竞争力的性能。 AI

影响 引入了一种使用Mamba模型进行文档图像二值化的新颖方法,有望提高在退化文档上的性能。

排序理由 这是一篇介绍特定计算机视觉任务的新模型架构的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Sheng-Wei Chan, Yung-Che Wang, Hsin-Jui Pan, Chia-Min Lin, Jen-Shiun Chiang ·

    DeepMine-Mamba:缓解基于Mamba的状态空间模型在文档图像二值化中的信息稀释问题

    arXiv:2606.08781v1 Announce Type: new Abstract: Document image binarization aims to separate foreground text from degraded backgrounds while preserving thin, broken, and low-contrast strokes. Although deep learning methods have improved binarization performance, most existing app…