研究人员开发了ImmersedPrivacy,一个使用Unity模拟器的交互式视听框架,用于评估视觉语言模型(VLMs)在物理环境中的隐私意识。他们的研究测试了12个最先进的模型,结果显示在复杂场景中识别敏感物品和适应不断变化的社会背景方面存在显著的性能缺陷。即使是表现最好的模型Gemini 1.5 Pro,在面对冲突指令时,也难以平衡任务完成与隐私保护。 AI
影响 突显了当前用于具身AI的视觉语言模型在隐私方面存在的关键差距,表明在现实世界应用中需要改进隐私保护能力。
排序理由 学术论文,提出了一种新的评估框架和对视觉语言模型的实证研究。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →