研究人员开发了 Trap$^2$,这是一个旨在防止未经授权的模型合并的新框架。该系统与架构无关,将保护直接编码到微调的权重中,当它们被重新组合成未经授权的混合体时会降级。Trap$^2$ 旨在解决模型中心带来的治理空白,确保发布的权重能够独立使用,同时破坏通过合并绕过安全对齐或许可条款的企图。 AI
影响 为防止通过未经授权的合并滥用已发布的 AI 模型提供了技术解决方案。
排序理由 该集群包含一篇详细介绍 AI 安全新技术的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →