研究人员推出了 IDP-Bench,这是一个旨在评估大型语言模型在相互依赖的隐私场景中保护个人信息能力的新基准。该基准以情境完整性框架为基础,测试 LLM 对他人未经同意可能泄露某人数据的理解能力。虽然目前开源模型在数据共同所有权识别方面表现强劲,但在识别隐私参数和判断数据共享的适当性方面却存在困难,这表明该领域需要更集中的研究。 AI
影响 强调了 LLM 隐私保护方面的关键差距,可能指导未来个人 AI 助手的模型开发和评估。
排序理由 学术论文,介绍 LLM 隐私的新基准。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →