研究人员 catalog 了 2023 年至 2026 年间 21 个框架中的 63 起 LLM-agent 预算超支事件,详细说明了财务损失并对失败类型进行了分类。为了缓解这些问题,他们开发了一个名为 `token-budgets` 的 Rust crate,该 crate 使用仿射(affine)类型来防止常见的错误,例如在编译时双重花费或在委托后使用预算。虽然更简单的 Python 实现可以处理单智能体任务,但 Rust crate 在多智能体场景中表现出更优越的安全性,可以防止导致超支的委托竞争。 AI
影响 提供了一个 LLM-agent 成本故障的分类法以及一种防止这些故障的新型类型系统方法,有可能降低运营成本并提高可靠性。
排序理由 学术论文,详细介绍了实证研究结果和提出的缓解策略。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →