PulseAugur
实时 03:04:59
English(EN) Decomposing Memorization Reduction in Privacy-Preserving Fine-Tuning of SLMs for CSIRTs

研究:DP SGD对CSIRT数据中的SLM记忆减少无效

一篇新的研究论文探讨了在计算机安全事件响应团队(CSIRT)的敏感数据上微调小型语言模型(SLM)时减少记忆的方法。研究发现,虽然差分隐私(DP SGD)提供了正式的隐私保证,但与匹配更新对照相比,它并未显著减少记忆。HMAC假名化可有效减少原始标识符的暴露,并且性能指标表明,在测试的训练预算下,10亿到30亿参数的SLM无法为CSIRT任务提供运行上可用的性能。 AI

影响 调查了在敏感数据上微调小型语言模型的隐私风险和性能限制,表明当前方法可能无法产生运行上可用的结果。

排序理由 一篇在arXiv上发表的研究论文,详细介绍了SLM隐私保护微调技术的实证研究。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究:DP SGD对CSIRT数据中的SLM记忆减少无效

报道来源 [1]

  1. arXiv cs.AI TIER_1 English(EN) · Cristhian Kapelinski, Diego Kreutz ·

    Decomposing Memorization Reduction in Privacy-Preserving Fine-Tuning of SLMs for CSIRTs

    arXiv:2606.28479v1 Announce Type: cross Abstract: CSIRTs increasingly fine tune language models on vulnerability scan records, but these records expose internal network topology and create privacy risks under regulations such as GDPR and LGPD. We present the first empirical study…