研究人员发现,将私有文档与外部工具(如网络搜索)相结合的AI代理存在重大的隐私风险。这种风险被称为“马赛克效应”,当单个查询看似无害,但聚合后会泄露敏感信息时就会发生。开发了一个新的基准MosaicLeaks,用于测试1001项任务中的这种漏洞。实验表明,当前的AI模型经常泄露私有信息,标准的隐私提示仅提供部分缓解,而注重性能的强化学习则加剧了该问题。引入了一个新颖的RL框架PA-DR,以平衡任务成功与隐私,并在测试中成功提高了准确性并减少了泄露。 AI
影响 强调了AI代理中关键的隐私漏洞,需要像PA-DR这样的新训练方法来保护敏感的企业数据。
排序理由 该集群包含一篇研究论文,详细介绍了评估AI代理隐私风险的新基准和方法。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →