PulseAugur
实时 08:23:34
实体 memory_recall_fact

memory_recall_fact

PulseAugur coverage of memory_recall_fact — every cluster mentioning memory_recall_fact across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_117356 ·

    新方法以99%的准确率检测AI代理记忆投毒

    研究人员通过分析AI代理的工具调用轨迹,发现了一种检测其记忆投毒攻击的新颖方法。他们发现了一个行为不变性,即成功的攻击总是涉及在调用`email_send_email`之前调用`memory_recall_fact`,而合法会话中很少出现这种序列。当与随机森林分类器结合使用时,这种不变性实现了高检测率(AUC = 0.9904),并且无需重新训练即可泛化到包括GPT-4.1和GPT-4o在内的各种模型。该方法还可以仅使用工具调用日志区…