PulseAugur
实时 11:01:05
English(EN) PersistBench: When Should Long-Term Memories Be Forgotten by LLMs?

新基准揭示大型语言模型长期记忆的安全风险

一个名为PersistBench的新基准已被开发出来,用于评估与大型语言模型长期记忆集成相关的安全风险。该基准确定了两个关键风险:跨域泄露,即将不相关的存储信息注入对话中;以及记忆诱导的谄媚,即强化偏见。测试显示,在18个前沿和开源大型语言模型中存在显著的失败率,凸显了在对话式AI中需要更强大的记忆管理。 AI

影响 突出了大型语言模型记忆系统中的关键安全漏洞,可能影响个性化AI助手的部署。

排序理由 该集群包含一篇介绍用于评估大型语言模型安全性的新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Sidharth Pulipaka, Oliver Chen, Manas Sharma, Taaha S Bajwa, Vyas Raina, Ivaxi Sheth ·

    PersistBench: When Should Long-Term Memories Be Forgotten by LLMs?

    arXiv:2602.01146v2 Announce Type: replace Abstract: Conversational assistants are increasingly integrating long-term memory with large language models (LLMs). This persistence of memories, e.g., the user is vegetarian, can enhance personalization in future conversations. However,…