English(EN) Differentially Private Auditing Under Strategic Response

新框架模拟了具有策略性开发者响应的AI审计

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-08 12:44

研究人员开发了一个新的框架，用于设计AI系统的监管审计，该框架考虑了开发者的策略性响应。所提出的方法将交互建模为一个双层Stackelberg博弈，其中审计员承诺查询策略和差分隐私（DP）预算，而开发者则策略性地重新分配缓解措施。这种方法旨在最小化福利加权的低检测差距，该差距代表了由于开发者的响应而导致审计未能检测到的危害。 AI

影响引入了一种新颖的博弈论方法，通过考虑开发者的策略性行为来提高AI审计的有效性。

排序理由详细介绍AI审计新理论框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

differential privacy

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Florian A. D. Burnat · 2026-05-08 12:44

战略响应下的差分隐私审计

Regulatory audits of AI systems increasingly rely on differential privacy (DP) to protect training data and model internals. We study audit design when the audited developer can strategically respond to the privacy-constrained audit interface. We formalize privacy-constrained aud…

报道来源 [1]

战略响应下的差分隐私审计

相关实体

相关话题