一项对五个 AI 代理技能安全扫描器的研究发现,它们在安全性评估上的一致性不到 36%。这些扫描器评估代码漏洞和提示注入等不同的安全方面,但它们之间经常出现矛盾,其中一个扫描器认为某个技能是安全的,而在 14.2% 的情况下,另一个扫描器却将其标记为极其危险。这种显著的分歧削弱了技能市场上“安全”徽章的可靠性,并凸显了验证 AI 代理技能安全性的根本性挑战。 AI
影响 凸显了信任 AI 代理技能安全认证方面存在的重大挑战,可能减缓其采用。
排序理由 该集群报告了一项评估 AI 代理技能安全扫描器有效性和一致性的研究。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →