PulseAugur
实时 23:46:09
English(EN) BEAM 100K memory benchmark: CSM vs Hindsight local artifact comparison [R]

Context Swarm Memory 在 BEAM 100K 基准测试中优于 Hindsight

一位开发者创建了一个名为 Context Swarm Memory (CSM) 的开源研发内存系统,并将其在 BEAM 100K 基准测试上的性能与 Hindsight 伪影进行了比较。CSM 取得了更高的 AMB 分数(0.757 对比 0.733),并使用了更少的上下文 token,尽管其检索时间较慢。开发者正在寻求关于如何提高此次本地比较的科学严谨性的反馈,以便提交官方接受。 AI

影响 这项研究提出了一个新的 AI 代理内存系统和基准测试比较,可能影响未来的代理开发和评估方法。

排序理由 该集群描述了一个新的开源系统和基准测试比较,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/MachineLearning 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/MachineLearning TIER_1 English(EN) · /u/keonakoum ·

    BEAM 100K 内存基准测试:CSM 与 Hindsight 本地伪影比较 [R]

    <!-- SC_OFF --><div class="md"><p>[R] </p> <p>BEAM 100K memory benchmark: CSM vs Hindsight local artifact comparison</p> <p>I’m looking for feedback on a local agent-memory benchmark comparison, especially from people who care about evaluation methodology.</p> <p>I built an open-…