PulseAugur
实时 07:36:40

LLM 内存系统在长历史记录上超越全上下文

一项新的基准测试 LongMemEval 表明,对于处理长对话历史的 LLM 代理,基于检索的内存系统优于全上下文基线。虽然在较短的交互中全上下文仍然具有竞争力,但随着历史长度的增加,基于内存的方法在准确性和令牌效率方面提供了显著的优势。这表明,对于处理广泛对话的代理来说,专门的内存引擎对于性能和成本效益都至关重要。 AI

影响 基于检索的内存系统为处理长对话的 LLM 代理提供了一种更高效、更准确的解决方案,有可能降低运营成本并改善用户体验。

排序理由 该集群展示了一项评估 LLM 内存系统与全上下文基线性能的新基准测试结果,详细说明了性能和成本权衡。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Baran Özdemir ·

    Memory在LongMemEval上胜过全上下文——以及我们未获的胜利

    <p>A common objection to agent memory is that you don't need it: context windows are huge now, so just put the whole history in the prompt. We wanted a real answer, not a vibe, so we ran two public long-term-memory benchmarks against a full-context baseline. Here's what we found …