研究人员推出了RedactionBench,这是一个新的基准测试,旨在评估大型语言模型在考虑上下文隐私的同时,能够多好地redact个人身份信息(PII)。该基准包含200份多样化的文档和一个新颖的R-Score指标,该指标考虑了redaction中的语义相似性。评估显示,包括具有agentic工具的前沿模型在内的当前模型在上下文redaction方面存在困难,人类标注者在何构成上下文redaction方面也存在显著分歧。 AI
影响 突显了LLM在敏感数据处理能力方面的一个关键差距,可能影响未来模型开发和隐私保护AI的评估标准。
排序理由 该集群描述了一篇介绍用于评估LLM能力的基准和指标的新学术论文。
- arXiv
- Hugging Face
- named-entity recognition
- personally identifiable information
- RedactionBench
- R score
- small language model
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →