对Google的Gemma 4 E2B模型的13个修改版本的全面分析显示,虽然所有变体都通过提高拒绝率显著提高了安全性,但其中一些也增强了推理能力。具体而言,coder3101和llmfan46这两个变体在GSM8K数学基准测试中表现优于基础模型。然而,更激进的修改导致语言建模性能和推理效率明显下降,一些变体显示出显著更高的困惑度(perplexity)和空响应。 AI
影响 证明了模型微调可以提高安全性与推理能力等特定能力,但激进的方法有损害核心性能的风险。
排序理由 对现有开源模型的多个微调变体的分析。[lever_c_demoted from research: ic=1 ai=1.0]
- coder3101
- Duoneural
- EtherOpus
- Gemma 4 E2B
- Huihui
- llmfan46
- treadon
- TrevorJS
- Wangzhang
- WWT CyberLab
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →