PulseAugur
实时 19:29:21
English(EN) 13 abliterated Gemma 4 E2B variants, 44 GPU hours, Benchmark and Comparison - Abliterlitics

Gemma 4 E2B变体显示出改进的安全性和部分推理能力的提升

对Google的Gemma 4 E2B模型的13个修改版本的全面分析显示,虽然所有变体都通过提高拒绝率显著提高了安全性,但其中一些也增强了推理能力。具体而言,coder3101和llmfan46这两个变体在GSM8K数学基准测试中表现优于基础模型。然而,更激进的修改导致语言建模性能和推理效率明显下降,一些变体显示出显著更高的困惑度(perplexity)和空响应。 AI

影响 证明了模型微调可以提高安全性与推理能力等特定能力,但激进的方法有损害核心性能的风险。

排序理由 对现有开源模型的多个微调变体的分析。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/nathandreamfast ·

    13 abliterated Gemma 4 E2B variants, 44 GPU hours, Benchmark and Comparison - Abliterlitics

    <!-- SC_OFF --><div class="md"><p>I compared 13 abliterated variants of Gemma 4 E2B across weight analysis, KL divergence, HarmBench safety, and 8 benchmark tasks. 44 GPU hours on a single RTX 5090. Here is what actually works and what destroys capabilities.</p> <p>coder3101's va…