PulseAugur
实时 07:42:31
English(EN) When Built-in Thinking Helps and Hurts: Constraint-Level Error Shifts in Instruction Following

LLM“思考”改变指令遵循错误模式

研究人员调查了在大型语言模型中启用内部“思考”过程如何影响其遵循指令的能力。他们发现,虽然整体性能变化不大,“思考”模式导致了错误模式的显著转变,一些指令得到改善,另一些则恶化。具体来说,涉及规划和协调的任务从思考中受益,而需要精确局部细节的任务则更容易出错。对模型激活的分析表明,在注重精度的任务中,错误更深地嵌入在模型的层中。 AI

影响 揭示了LLM的内部推理机制如何在指令遵循准确性方面导致权衡,影响提示工程和模型评估。

排序理由 这是一篇详细介绍LLM行为研究结果的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Sai Adith Senthil Kumar ·

    内置思维的助益与损害:指令遵循中的约束级错误转移

    Large reasoning models (LRMs) often improve math and coding performance, but their effect on instruction following is unclear. We study IFEval with Qwen3 models (1.7B-32B), using same-weights Thinking ON/OFF controls; four Hunyuan models provide directional cross-family support. …