PulseAugur
实时 14:05:06
English(EN) Gefen is a drop-in replacement for the AdamW optimizer, claims 8x memory reduction in training (GitHub available)

Gefen 优化器声称 LLM 训练内存减少 8 倍

Gefen 是一种新的优化器,旨在作为 AdamW 的直接替代品,目标是显著减少模型训练期间的内存使用量。开发者声称 Gefen 可以实现高达 8 倍的内存需求减少。该项目已在 GitHub 上发布了其代码并发表了相应的论文。 AI

影响 可能能够训练更大的模型或更有效地利用现有硬件进行 LLM 开发。

排序理由 该条目描述了一篇新的研究论文和相关的优化器代码发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Gefen 优化器声称 LLM 训练内存减少 8 倍

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/indicava ·

    Gefen is a drop-in replacement for the AdamW optimizer, claims 8x memory reduction in training (GitHub available)

    <!-- SC_OFF --><div class="md"><p>Paper: <a href="https://arxiv.org/abs/2606.13894">https://arxiv.org/abs/2606.13894</a></p> <p>GitHub: <a href="https://github.com/ndvbd/Gefen">https://github.com/ndvbd/Gefen</a></p> </div><!-- SC_ON --> &#32; submitted by &#32; <a href="https://w…