一位Reddit用户对KV量化的有效性表示惊讶,指出即使在Q4_0量化级别下,它也能从10万token的上下文中准确检索信息。该用户分享了展示此能力的截图,其中一个例子引用了2026年一本书中的冷门知识,表明模型的性能超出了常见训练数据。 AI
排序理由 该集群在用户论坛中讨论了一个技术细节(KV量化),但并未提出新的研究、产品发布或重要的行业新闻。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
一位Reddit用户对KV量化的有效性表示惊讶,指出即使在Q4_0量化级别下,它也能从10万token的上下文中准确检索信息。该用户分享了展示此能力的截图,其中一个例子引用了2026年一本书中的冷门知识,表明模型的性能超出了常见训练数据。 AI
排序理由 该集群在用户论坛中讨论了一个技术细节(KV量化),但并未提出新的研究、产品发布或重要的行业新闻。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u6bwz0/im_still_surprised_on_how_good_the_kv/"> <img alt="I'm still surprised on how good the kv quantization has become" src="https://preview.redd.it/78b1nuc63f7h1.png?width=140&height=87&auto=webp&a…