用户在控制大型语言模型的推理过程时遇到困难,即使在系统提示中提供了明确的指令。尽管试图限制token使用或防止过度草稿,模型通常仍会继续生成重复或浪费性的推理步骤。这个问题在包括Gemma 4 26b在内的各种模型中普遍存在,导致token消耗效率低下,思维过程缺乏富有成效的输出。 AI
影响 用户正在寻求提高大型语言模型推理过程效率和可控性的方法。
排序理由 用户讨论大型语言模型的某个技术挑战。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
用户在控制大型语言模型的推理过程时遇到困难,即使在系统提示中提供了明确的指令。尽管试图限制token使用或防止过度草稿,模型通常仍会继续生成重复或浪费性的推理步骤。这个问题在包括Gemma 4 26b在内的各种模型中普遍存在,导致token消耗效率低下,思维过程缺乏富有成效的输出。 AI
影响 用户正在寻求提高大型语言模型推理过程效率和可控性的方法。
排序理由 用户讨论大型语言模型的某个技术挑战。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →
<!-- SC_OFF --><div class="md"><p>I'm curious if anyone who is more familiar with the inner workings of LLMs can explain why does it seem like all reasoning models (or at least the ones i tried) always ignore any user instructions related to reasoning?</p> <p>Everyone probably ex…