English(EN) Knowing When to Ask: Segment-Level Credit Assignment for LLM Tool Use

新的CARL方法教会LLM何时使用外部工具

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-28 04:00

研究人员开发了CARL（Competence-Aware Reinforcement Learning，能力感知强化学习），一种新颖的方法，用于改进大型语言模型（LLM）决定何时使用外部工具的方式。与以往在工具使用的信用分配或不必要调用惩罚方面存在困难的方法不同，CARL训练一个评论家来区分模型自身知识可解决的问题和需要外部帮助的问题。这使得模型能够减少不必要地调用工具，同时提高准确性，尤其有利于参数记忆较少的较小模型。 AI

影响通过实现更好的决策来决定何时利用外部工具，从而提高LLM的效率和准确性。

排序理由这是一篇详细介绍LLM工具使用新方法的论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

CARL
LLM

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Abhijit Kumar, Zoey Wu, Mohit Suley · 2026-05-28 04:00

何时提问：LLM工具使用的分段级信用分配

arXiv:2605.27788v1 Announce Type: cross Abstract: Humans know when to reach for help e.g. $347 \times 28$ warrants a calculator while $2+2$ does not. Language models do not. Prompt-based approaches can instruct a model when to invoke tools, but this scaffolding does not teach it …

报道来源 [1]

何时提问：LLM工具使用的分段级信用分配

相关实体

相关话题