研究人员开发了一种名为 PEEU(Planning Experience Exploration and Utilization,规划经验探索与利用)的新方法,以增强小型开源多模态大语言模型(MLLMs)在 GUI 代理任务规划方面的能力。该方法通过自主探索环境以收集经验,并利用事后经验创建高级训练数据,解决了这些模型在规划和跨网站泛化方面的局限性。实验表明,PEEU 显著提高了性能,一个 7B 模型达到了 30.6% 的准确率,超过了更大的 Qwen2.5-VL-32B 模型,并证明了事后高级任务构建对于分布外规划的重要性。 AI
影响 增强了小型开源 LLM 在实际 GUI 代理应用中的规划和泛化能力。
排序理由 该集群包含一篇详细介绍新方法和改进 LLM 能力的实验结果的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →