English(EN) One Token per Multimodal Evidence: Latent Memory for Resource-Constrained QA

潜在记忆通过潜在证据压缩减少问答令牌使用量

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-09 08:36

研究人员开发了一种名为潜在记忆的新方法，用于处理使用多模态证据的问答系统。该方法将文本和图像证据压缩成单个高维潜在令牌，显著减少了生成过程中的令牌消耗。通过在统一的潜在空间中运行，潜在记忆在各种问答基准测试中取得了具有竞争力的性能，同时比传统的基于检索的方法少使用 3 到 10 倍的生成器令牌。 AI

影响降低了多模态问答系统的计算成本，使其在资源受限的应用中更易于访问。

排序理由该集群包含一篇学术论文，详细介绍了多模态问答的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Wee Sun Lee · 2026-06-09 08:36

每个模态证据一个Token：面向资源受限问答的潜在记忆

External memory effectively grounds large language models (LLMs) and vision-language models (VLMs)-based question answering (QA) in relevant multimodal evidence. However, existing memory paradigms represent each memory item in raw text and image forms, so retrieval-based systems …

报道来源 [1]

每个模态证据一个Token：面向资源受限问答的潜在记忆

相关实体

相关话题