English(EN) How Far Are VLMs from Privacy Awareness in the Physical World? An Empirical Study

视觉语言模型在物理世界模拟中表现出显著的隐私缺陷

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 04:00

研究人员开发了ImmersedPrivacy，一个使用Unity模拟器的交互式视听框架，用于评估视觉语言模型（VLMs）在物理环境中的隐私意识。他们的研究测试了12个最先进的模型，结果显示在复杂场景中识别敏感物品和适应不断变化的社会背景方面存在显著的性能缺陷。即使是表现最好的模型Gemini 1.5 Pro，在面对冲突指令时，也难以平衡任务完成与隐私保护。 AI

影响突显了当前用于具身AI的视觉语言模型在隐私方面存在的关键差距，表明在现实世界应用中需要改进隐私保护能力。

排序理由学术论文，提出了一种新的评估框架和对视觉语言模型的实证研究。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Junran Wang, Xinjie Shen, Zehao Jin, Pan Li · 2026-05-08 04:00

视觉语言模型（VLMs）在物理世界中的隐私意识还有多远？一项实证研究

arXiv:2605.05340v1 Announce Type: cross Abstract: As Vision-Language Models (VLMs) are increasingly deployed as autonomous cognitive cores for embodied assistants, evaluating their privacy awareness in physical environments becomes critical. Unlike digital chatbots, these agents …

报道来源 [1]

视觉语言模型（VLMs）在物理世界中的隐私意识还有多远？一项实证研究

相关实体

相关话题