PulseAugur
实时 05:23:57

Google 的 Gemma 4 31B 模型通过最小化 VRAM 实现风格调整

Google 的 Gemma 4 31B 模型的一个新微调版本已发布,名为 Gryphe/Gemma-4-31B-StyleTune。此微调过程专注于仅改变控制 token 发射的 lm_head 张量,以显著减少陈词滥调并引入新的写作风格,同时保留模型的核心能力。开发者声称此方法极大地降低了 VRAM 需求,并允许在消费级硬件上进行通宵训练,基准测试显示陈词滥调减少了 60%,词汇量发生了明显变化。 AI

影响 展示了一种新颖的、低资源的 LLM 微调方法,该方法在改变风格的同时保留了核心能力。

排序理由 发布了一个具有新颖训练技术微调的模型。 [lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Trending Models 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Google 的 Gemma 4 31B 模型通过最小化 VRAM 实现风格调整

报道来源 [1]

  1. Hugging Face Trending Models TIER_1 English(EN) · Gryphe ·

    Gryphe/Gemma-4-31B-StyleTune

    text-generation · 278 downloads · 46 likes