English(EN) Why We Think

Lilian Weng 探讨测试时计算如何增强大型语言模型的推理能力

作者 PulseAugur 编辑部 · [1 个来源] · 2025-05-01 00:00

Lilian Weng 的最新博文探讨了大型语言模型中的“思考时间”或测试时计算的概念。这种方法借鉴了人类认知，即复杂问题需要深思熟虑的慢速思考（系统 2），而不是即时、直观的反应（系统 1）。该博文详细介绍了在测试时增加计算量，例如通过思维链提示（Chain-of-Thought prompting），如何使模型能够执行更多操作，并可能提高准确性，尤其是在具有挑战性的任务上。Weng 还将其置于潜在变量建模的框架内，认为涉及多种推理路径的方法可以被视为从后验分布中采样。 AI

排序理由一位可信研究员的博文，讨论了人工智能概念和研究方向。

在 Lil'Log (Lilian Weng) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Lil'Log (Lilian Weng) TIER_1 English(EN) · 2025-05-01 00:00

Why We Think

Special thanks to <a href="https://scholar.google.com/citations?user=itSa94cAAAAJ&hl=en">John Schulman</a> for a lot of super valuable feedback and direct edits on this post. Test time compute (<a href="https://arxiv.org/abs/1603.08983">G…

报道来源 [1]

Why We Think

相关话题