PulseAugur
实时 03:03:09
English(EN) Why does it seems to be so difficult to control a model's reasoning process?

尽管有系统提示指令,用户仍难以控制大型语言模型的推理

用户在控制大型语言模型的推理过程时遇到困难,即使在系统提示中提供了明确的指令。尽管试图限制token使用或防止过度草稿,模型通常仍会继续生成重复或浪费性的推理步骤。这个问题在包括Gemma 4 26b在内的各种模型中普遍存在,导致token消耗效率低下,思维过程缺乏富有成效的输出。 AI

影响 用户正在寻求提高大型语言模型推理过程效率和可控性的方法。

排序理由 用户讨论大型语言模型的某个技术挑战。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/iz-Moff ·

    Why does it seems to be so difficult to control a model's reasoning process?

    <!-- SC_OFF --><div class="md"><p>I'm curious if anyone who is more familiar with the inner workings of LLMs can explain why does it seem like all reasoning models (or at least the ones i tried) always ignore any user instructions related to reasoning?</p> <p>Everyone probably ex…