PulseAugur
实时 12:46:04
English(EN) MM-Matryoshka: Towards Budget-Elastic Visual Document Retrieval via a 2D Multimodal Matryoshka Training Framework

MM-Matryoshka框架提供预算弹性的视觉文档检索

研究人员推出了一种新颖的二维训练框架MM-Matryoshka,旨在使视觉文档检索更具预算弹性。该方法允许单个模型通过选择灵活的向量宽度和编码器深度预算来根据可用计算资源调整其检索准确性。实验表明,与现有方法相比,MM-Matryoshka在保持高质量检索的同时,显著降低了存储和计算开销。 AI

影响 通过允许动态调整计算资源,从而能够更有效地部署视觉文档检索系统。

排序理由 这是一篇描述用于视觉文档检索的新框架的研究论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Haowen Xiang, Yibo Yan, Jiahao Huo, Yu Huang, Yi Cao, Mingdong Ou, Xuming Hu ·

    MM-Matryoshka:通过二维多模态俄罗斯套娃训练框架实现面向预算弹性的视觉文档检索

    arXiv:2606.07654v1 Announce Type: cross Abstract: Multi-vector visual document retrievers achieve strong fine-grained matching by representing each page with multiple vectors from deep Vision-Language Models (VLMs), but this design makes deployment expensive in both storage and c…