PulseAugur
实时 03:54:52
English(EN) One Token per Multimodal Evidence: Latent Memory for Resource-Constrained QA

潜在记忆通过潜在证据压缩减少问答令牌使用量

研究人员开发了一种名为潜在记忆的新方法,用于处理使用多模态证据的问答系统。该方法将文本和图像证据压缩成单个高维潜在令牌,显著减少了生成过程中的令牌消耗。通过在统一的潜在空间中运行,潜在记忆在各种问答基准测试中取得了具有竞争力的性能,同时比传统的基于检索的方法少使用 3 到 10 倍的生成器令牌。 AI

影响 降低了多模态问答系统的计算成本,使其在资源受限的应用中更易于访问。

排序理由 该集群包含一篇学术论文,详细介绍了多模态问答的新方法。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Wee Sun Lee ·

    每个模态证据一个Token:面向资源受限问答的潜在记忆

    External memory effectively grounds large language models (LLMs) and vision-language models (VLMs)-based question answering (QA) in relevant multimodal evidence. However, existing memory paradigms represent each memory item in raw text and image forms, so retrieval-based systems …