研究人员开发了 RTPrune,一种新颖的两阶段令牌剪枝方法,旨在提高 DeepSeek-OCR 推理的效率。该方法模仿了模型两次阅读的过程,首先优先处理高范数令牌以获取显著信息,然后使用最优传输理论合并剩余令牌。RTPrune 还包含针对 OCR 任务定制的动态剪枝比例,实现了准确性和效率之间的卓越平衡。 AI
影响 提高了 OCR 任务的推理速度和效率,可能降低处理长文档的计算成本。
排序理由 这是一篇研究论文,详细介绍了一种优化现有 OCR 模型推理效率的新方法。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →