English(EN) DuoMem: Towards Capable On-Device Memory Agents via Dual-Space Distillation

DuoMem 框架通过双空间蒸馏实现强大的设备端 LLM 代理

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-30 04:00

研究人员开发了 DuoMem，一个新颖的双空间蒸馏框架，旨在实现强大的设备端记忆代理。该方法将大型语言模型 (LLM) 的程序性问题解决能力转移到更小、更高效的学生模型中。DuoMem 通过在上下文空间（使用教师生成的记忆）和参数空间（通过在成功的教师轨迹上微调轻量级适配器）中蒸馏知识来实现这一点。在 ALFWorld 基准测试上的评估表明，DuoMem 显著提升了一个 4B 参数模型的性能，任务成功率达到 77.9%，并且完成任务的速度比 72B 教师模型快三倍以上，使其适用于实时边缘部署。 AI

影响使资源受限设备上的 AI 代理功能更强大，可能加速实时边缘部署。

排序理由该集群包含一篇详细介绍 LLM 代理新框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Peyman Hosseini, Ondrej Bohdal, Ahmed Alajrami, Andrea Maracani, Ignacio Castro, Matthew Purver, Mete Ozay, Savas Ozkan, Taha Ceritli · 2026-06-30 04:00

DuoMem：通过双空间蒸馏实现面向能力的设备端记忆体代理

arXiv:2606.29961v1 Announce Type: cross Abstract: Large Language Model (LLM)-based agents can solve complex procedural tasks by interacting with environments over multiple turns, but this ability typically depends on large models, long contexts, and repeated inference calls. This…

报道来源 [1]

DuoMem：通过双空间蒸馏实现面向能力的设备端记忆体代理

相关实体

相关话题