PulseAugur
实时 16:37:46

新的RedactionBench基准揭示LLM在上下文PII redaction方面存在困难

研究人员推出了RedactionBench,这是一个新的基准测试,旨在评估大型语言模型在考虑上下文隐私的同时,能够多好地redact个人身份信息(PII)。该基准包含200份多样化的文档和一个新颖的R-Score指标,该指标考虑了redaction中的语义相似性。评估显示,包括具有agentic工具的前沿模型在内的当前模型在上下文redaction方面存在困难,人类标注者在何构成上下文redaction方面也存在显著分歧。 AI

影响 突显了LLM在敏感数据处理能力方面的一个关键差距,可能影响未来模型开发和隐私保护AI的评估标准。

排序理由 该集群描述了一篇介绍用于评估LLM能力的基准和指标的新学术论文。

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Sean Brynj\'olfsson, Shashvat Jayakrishnan, Esha Sali, Diptanshu Purwar, Madhav Aggarwal ·

    RedactionBench

    arXiv:2606.18782v1 Announce Type: cross Abstract: Large Language Models are increasingly applied to sensitive domains that require redaction of personally identifiable information (PII). While redacting PII is a data cleaning prerequisite, existing benchmarks conflate extraction …

  2. arXiv cs.AI TIER_1 English(EN) · Madhav Aggarwal ·

    RedactionBench

    Large Language Models are increasingly applied to sensitive domains that require redaction of personally identifiable information (PII). While redacting PII is a data cleaning prerequisite, existing benchmarks conflate extraction mechanics with privacy semantics. A public phone n…