研究人员推出了一种新颖的分层重规划框架H-RePlan,旨在增强多设备代理系统的鲁棒性。该框架通过使代理能够区分可修复的设备本地故障和需要更广泛重规划的故障,解决了当前系统的局限性。为了评估其有效性,开发了一个名为HeraBench的新故障注入基准,该基准模拟了Linux和Android设备上的跨设备工作流。实验表明,与现有基线相比,H-RePlan显著提高了任务完成率并降低了代币成本。 AI
影响 增强了在多个设备和应用程序上运行的AI代理的可靠性。
排序理由 该集群包含一篇详细介绍代理系统新框架和基准的学术论文。
- android
- arXiv
- HeraBench
- H-RePlan
- Hugging Face
- Linux
- alphaXiv
- CatalyzeX
- DagsHub
- Gotit.pub
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →