PulseAugur
实时 10:54:47
English(EN) IDP-Bench: Benchmarking ability of LLMs to protect personal information in interdependent privacy contexts

新基准测试 LLM 在相互依赖的隐私风险方面的能力

研究人员推出了 IDP-Bench,这是一个旨在评估大型语言模型在相互依赖的隐私场景中保护个人信息能力的新基准。该基准以情境完整性框架为基础,测试 LLM 对他人未经同意可能泄露某人数据的理解能力。虽然目前开源模型在数据共同所有权识别方面表现强劲,但在识别隐私参数和判断数据共享的适当性方面却存在困难,这表明该领域需要更集中的研究。 AI

影响 强调了 LLM 隐私保护方面的关键差距,可能指导未来个人 AI 助手的模型开发和评估。

排序理由 学术论文,介绍 LLM 隐私的新基准。 [lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Ayana Hussain, Soumya Sharma, Golnoosh Farnadi, Nicholas Vincent, H\'eber Hwang Arcolezi, Ulrich A\"ivodji ·

    IDP-Bench: Benchmarking ability of LLMs to protect personal information in interdependent privacy contexts

    arXiv:2606.09908v1 Announce Type: cross Abstract: Large language models (LLMs) are becoming widely deployed as personal AI assistants with access to sensitive user data, making privacy a major challenge for their design and evaluation. Prior work focuses mainly on individual-leve…