近期研究表明,大型语言模型在可靠的自我纠正方面存在困难,尤其是在没有外部反馈的情况下试图修改自己的推理时。对 Self-Refine 和 Cannot-Self-Correct 等方法的研究表明,模型最初的置信度经常会延续到修改中,从而可能降低性能。虽然 Reflexion 等方法通过外部成功/失败信号来控制自我纠正,提供了一种部分解决方案,但它们并非万无一失,如果信号不可靠,仍可能导致错误。自我纠正的有效性在一两次迭代后也会迅速下降,后续的迭代可能会引入新的错误或过度编辑正确的响应。 AI
影响 LLM 中的自我纠正循环不如之前认为的有效,尤其是在没有外部验证的情况下,这限制了它们在自主代理中的效用。
排序理由 该集群包含多篇研究论文和博客文章,讨论了 LLM 自我纠正机制的局限性。
AI 生成摘要 · Google Gemini · 来自 7 个来源。 我们如何撰写摘要 →