研究人员开发了 MultiPriv,这是一个用于评估视觉语言模型 (VLM) 个人隐私推理能力的新基准。该基准包含一个双语多模态数据集,旨在将面部和姓名等标识符与敏感属性相关联,从而能够执行属性检测和链式推理等任务。初步评估显示,60% 的受测 VLM 能够以高达 80% 的准确率执行个人隐私推理,凸显了重大的隐私风险。 AI
影响 凸显了 VLM 中重大的隐私风险,可能影响未来的模型开发和数据处理实践。
排序理由 该集群包含一篇介绍用于评估 AI 模型的新基准的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →