PulseAugur
实时 12:43:29

新的剪枝方法大幅减小视觉文档检索模型尺寸

研究人员开发了一种新颖的无训练方法——结构锚点剪枝(SAP),用于压缩视觉文档检索模型。SAP通过识别和剪枝冗余的视觉标记来解决这些模型中多向量索引的显著存储开销问题,且无需依赖查询进行训练。该框架利用得分保留诊断和视觉入度中心性评分器,在保持高检索精度的同时有效减小了索引尺寸。 AI

影响 引入了一种降低视觉文档检索系统存储成本的技术,可能支持更广泛的部署。

排序理由 该集群包含一篇详细介绍新模型压缩方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Zhuchenyang Liu, Ziyu Hu, Yao Zhang, Yu Xiao ·

    Structural Anchor Pruning: Training-Free Multi-Vector Compression for Visual Document Retrieval

    arXiv:2601.20107v2 Announce Type: replace-cross Abstract: Recent Vision-Language Models (e.g., ColPali) enable fine-grained Visual Document Retrieval (VDR) but incur prohibitive multi-vector index storage overhead. Existing training-free pruning methods either rely on heuristic l…