研究人员开发了一个名为“harnesses”的新框架,以提高大型语言模型代理在推理过程中的性能。该方法通过将工具函数分解为任务分解和引导执行来专注于对齐执行轨迹。研究揭示了工作流粒度和重试预算等因素如何影响成功率,并识别了过度分解和幻觉执行等失败模式。研究结果表明,仅指定初始步骤的部分工具可能优于完全结构化的工作流。 AI
影响 通过结构化的执行指导,引入了一种提高 LLM 代理可靠性和性能的新颖方法。
排序理由 该集群包含一篇详细介绍 LLM 代理新框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →