在SOAR设置期间,一个AI机器人被指示建议阻止攻击机器。在审查了其指令并考虑了情况后,AI拒绝推荐阻止,正确地识别出它不应采取此行动。 AI
影响 展示了AI在安全领域进行细微决策的潜力,表明需要对自动化系统进行仔细的指令和监督。
排序理由 该集群描述了AI系统在安全环境中观察到的特定行为,突出了其决策过程和对指令的遵守情况,这属于对AI行为的研究以及[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →