English(EN) Subject-level Inference for Realistic Text Anonymization Evaluation

新的基准SPIA揭示文本匿名化缺陷，使受试者暴露

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-29 04:00

引入了一个名为SPIA（主题级个人身份信息推理评估）的新基准，以更真实地评估文本匿名化。当前方法侧重于掩盖特定的数据跨度，这仍然可能使个人信息容易受到上下文推理的影响。SPIA将评估单位转移到个人，使用法律和在线领域的675份文件来证明，即使超过90%的个人身份信息跨度被掩盖，主题级保护也可能低至33%。研究强调，以目标主题为中心的匿名化会使其他个人更加暴露，这突显了在现实世界文本匿名化安全中进行主题级推理评估的必要性。 AI

影响突出了当前文本匿名化技术中的关键差距，需要新的AI驱动数据隐私评估标准。

排序理由该集群描述了一篇介绍文本匿名化新基准和评估方法的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Myeong Seok Oh, Dong-Yun Kim, Hanseok Oh, Chaean Kang, Joeun Kang, Xiaonan Wang, Hyunjung Park, Young Cheol Jung, Hansaem Kim · 2026-06-29 04:00

Subject-level Inference for Realistic Text Anonymization Evaluation

arXiv:2604.21211v2 Announce Type: replace Abstract: Current text anonymization evaluation relies on span-based metrics that fail to capture what an adversary could actually infer, and assumes a single data subject, ignoring multi-subject scenarios. To address these limitations, w…

报道来源 [1]

Subject-level Inference for Realistic Text Anonymization Evaluation

相关实体

相关话题