Norsk(NO) SkillHarness: Harnessing Safe Skills for Computer-Use Agents

新基准揭示计算机使用AI代理存在高隐私风险

作者 PulseAugur 编辑部 · [2 个来源] · 2026-06-02 00:00

已开发出一个名为AgentCIBench的新评估工具，用于评估计算机使用代理（CUA）的上下文完整性。这些代理在电子邮件和日历等个人应用程序中运行，可能将一个上下文中的敏感信息暴露给另一个上下文，从而带来隐私风险。AgentCIBench识别出三种常见的故障模式：视觉共址、任务歧义过度分享和接收者错位。对15个前沿代理的测试显示失败率很高，其中11个代理在超过50%的场景中泄露信息，平均泄露率为67.9%。研究人员希望通过发布AgentCIBench作为部署前安全检查，来促进更安全的CUA的开发。 AI

影响突显了与个人应用程序交互的AI代理中存在的关键隐私漏洞，需要在部署前进行新的安全检查。

排序理由该集群包含一篇介绍AI代理新评估基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Daily Papers 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。我们如何撰写摘要 →

报道来源 [2]

arXiv cs.AI TIER_1 English(EN) · Iryna Gurevych · 2026-06-22 11:36

Capable but Careless: Do Computer-Use Agents Follow Contextual Integrity?

Computer-use agents (CUAs) now act on a user's behalf across personal applications such as email, calendars, and to-do lists. This cross-application access is useful, but it also creates a privacy risk that has been largely overlooked: when an agent works in one context, it can p…
Hugging Face Daily Papers TIER_1 Norsk(NO) · 2026-06-02 00:00

SkillHarness: Harnessing Safe Skills for Computer-Use Agents

SkillHarness is a framework that enables computer-use agents to safely learn and execute skills in dynamic environments by incorporating safety constraints and adaptive skill selection mechanisms.

报道来源 [2]

Capable but Careless: Do Computer-Use Agents Follow Contextual Integrity?

SkillHarness: Harnessing Safe Skills for Computer-Use Agents

相关实体

相关话题