PulseAugur
实时 06:41:10

新系统为图表问题路由以节省VLM成本

研究人员开发了SAFE-Cascade系统,该系统通过在仅文本语言模型和更强大的视觉语言模型(VLM)之间自适应地路由查询来优化图表问答。这种方法旨在通过仅在必要时调用VLM来降低成本和延迟,具体取决于评估问题和图表复杂性的学习路由器。该系统在准确性方面与完整的VLM基线相当,同时显著减少了VLM的使用和估计成本。 AI

影响 这种方法可以通过优化资源分配,实现更具成本效益和透明度的多模态AI系统。

排序理由 该集群描述了一篇研究论文,其中详细介绍了一个新系统及其在基准测试上的性能。

在 arXiv cs.IR (Information Retrieval) 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新系统为图表问题路由以节省VLM成本

报道来源 [2]

  1. arXiv cs.IR (Information Retrieval) TIER_1 English(EN) · Xintao Wu ·

    SAFE-Cascade:面向图表问答的成本自适应视觉语言路由

    Vision-language models (VLMs) are powerful for chart question answering, but invoking a VLM for every query can be unnecessarily expensive when many questions are answerable from OCR text and lightweight language reasoning. We demonstrate SAFE-Cascade, an interactive system for c…

  2. arXiv cs.CV TIER_1 English(EN) · Ayush Dwivedi, Qixin Wang, Ashvi Soni, Ruoteng Wang, Han Li, Animesh Mahapatra, Neeraj Agrawal, Xintao Wu ·

    SAFE-Cascade:面向图表问答的成本自适应视觉语言路由

    arXiv:2606.19646v1 Announce Type: cross Abstract: Vision-language models (VLMs) are powerful for chart question answering, but invoking a VLM for every query can be unnecessarily expensive when many questions are answerable from OCR text and lightweight language reasoning. We dem…