研究人员分析了大型语言模型 (LLM) 中 Agent 内存的内部工作原理,特别是检查了 Qwen-3 系列和两个内存框架。他们的发现表明,控制电路在比内容电路更小的模型尺寸(0.6B 参数)下变得活跃,而内容电路仅在 4B 参数下显示可检测信号。研究还发现,写入和读取操作共享一个公共中心,并且虽然内容电路在 4B 时即可检测到,但只有在 8B 参数下才能可靠地进行引导。 AI
影响 识别 Agent 内存控制和内容的独特尺度阈值,可能为无声故障提供更精确的诊断。
排序理由 关于 LLM 中 Agent 内存电路分析的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →