PulseAugur
实时 12:21:58
English(EN) Fast little local memory retriever for Hermes

LocalLLaMA 用户为 NPUs 上的 Hermes 寻求快速内存检索器

r/LocalLLaMA 上的一位用户正在为 Hermes 模型寻找一个快速的本地内存检索器,特别是希望能在 NPU 上运行的。他们正在考虑 GPT OSS 20B,但发现它对于拉取记忆所需的吞吐量来说太慢了。该用户还对使用 Bonsai 1 bitLFM 等小型模型优化代理子任务感兴趣,并寻求社区的意见。 AI

影响 用户正在探索优化本地 LLM 在代理子任务上的性能的方法,这表明了向更高效的设备端 AI 处理发展的趋势。

排序理由 用户正在论坛上征求建议,而不是宣布新产品或研究。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LocalLLaMA 用户为 NPUs 上的 Hermes 寻求快速内存检索器

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/Miserable-Dare5090 ·

    Fast little local memory retriever for Hermes

    <!-- SC_OFF --><div class="md"><p>As title says. Looking for suggestions of a good memory retriever (for use with hindsight/hermes) ideally that can run on a strix halo NPU. GPT OSS 20B would be good based on their outdated rankings but it’s slow on the NPU for this type of task …