研究人员推出REDACT,这是一个新的多语言基准,旨在系统性地评估个人身份信息(PII)的检测能力。该基准包含超过13,000条记录,324,000个标注,涵盖51种实体类型,并支持25种语言。研究评估了包括GPT-4.1和Claude Sonnet 4.6在内的五种检测器,结果表明,虽然基于LLM的检测器通常更强大,但它们的性能会因数据敏感性和披露形式而显著不同。该基准旨在提供对PII检测能力更受控、更全面的评估。 AI
影响 为PII检测提供了一个更强大的评估框架,这对于负责任的AI部署和数据隐私至关重要。
排序理由 该集群描述了一个新的学术基准和对PII检测系统的评估。
- Claude Sonnet 4.6
- GLiNER
- GPT-4.1
- OpenAI Privacy Filter
- Presidio
- arXiv
- General Data Protection Regulation
- Hugging Face
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →