Google 的 Gemma 4 31B 模型的一个新微调版本已发布,名为 Gryphe/Gemma-4-31B-StyleTune。此微调过程专注于仅改变控制 token 发射的 lm_head 张量,以显著减少陈词滥调并引入新的写作风格,同时保留模型的核心能力。开发者声称此方法极大地降低了 VRAM 需求,并允许在消费级硬件上进行通宵训练,基准测试显示陈词滥调减少了 60%,词汇量发生了明显变化。 AI
影响 展示了一种新颖的、低资源的 LLM 微调方法,该方法在改变风格的同时保留了核心能力。
排序理由 发布了一个具有新颖训练技术微调的模型。 [lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Trending Models 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →