English(EN) 13 abliterated Gemma 4 E2B variants, 44 GPU hours, Benchmark and Comparison - Abliterlitics

Gemma 4 E2B变体显示出改进的安全性和部分推理能力的提升

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-31 13:44

对Google的Gemma 4 E2B模型的13个修改版本的全面分析显示，虽然所有变体都通过提高拒绝率显著提高了安全性，但其中一些也增强了推理能力。具体而言，coder3101和llmfan46这两个变体在GSM8K数学基准测试中表现优于基础模型。然而，更激进的修改导致语言建模性能和推理效率明显下降，一些变体显示出显著更高的困惑度（perplexity）和空响应。 AI

影响证明了模型微调可以提高安全性与推理能力等特定能力，但激进的方法有损害核心性能的风险。

排序理由对现有开源模型的多个微调变体的分析。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/nathandreamfast · 2026-05-31 13:44

13 种 Gemma 4 E2B 变体，44 GPU 小时，基准测试与比较 - Abliterlitics

<div class="md"><p>I compared 13 abliterated variants of Gemma 4 E2B across weight analysis, KL divergence, HarmBench safety, and 8 benchmark tasks. 44 GPU hours on a single RTX 5090. Here is what actually works and what destroys capabilities.</p> <p>coder3101's va…

报道来源 [1]

13 种 Gemma 4 E2B 变体，44 GPU 小时，基准测试与比较 - Abliterlitics

相关实体

相关话题