研究人员推出了MosaicLeaks,这是一个新的基准,旨在评估将私人本地文档与外部工具相结合的AI研究代理所带来的隐私风险。这些代理可能会通过其网络查询无意中泄露敏感信息,即使单个查询看起来无害。MosaicLeaks基准包含超过1000个多跳研究链,这些研究链交织了公共和私人信息,以模拟真实世界的场景。已经开发了一种新颖的训练方法,称为隐私感知深度研究(PA-DR),以减轻这种泄露,提高了任务成功率,同时显著减少了通过代理查询暴露的私人信息量。 AI
影响 突显了AI代理中一个关键的隐私漏洞,可能影响未来的代理设计和安全协议。
排序理由 该集群描述了一个新的研究基准和一种为AI代理提出的训练方法。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →