研究人员开发了 ContinuousBench,这是一个旨在评估差分隐私(DP)合成文本在提升模型能力方面的有效性的新基准。与容易饱和的现有基准不同,ContinuousBench 使用连续重新生成的数据集来确保任务在没有特定训练语料库的情况下是不可解的。初步研究结果表明,虽然非私有合成数据可以转移大量知识,但目前最先进的 DP 合成方法即使在放宽隐私参数的情况下也难以做到这一点。 AI
影响 该基准可以揭示当前 DP 合成方法的局限性,可能指导未来研究朝着更有效的 AI 隐私保护数据生成方向发展。
排序理由 该集群包含一篇介绍用于评估人工智能能力的新基准的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →