Gefen 是一种新的优化器,旨在作为 AdamW 的直接替代品,目标是显著减少模型训练期间的内存使用量。开发者声称 Gefen 可以实现高达 8 倍的内存需求减少。该项目已在 GitHub 上发布了其代码并发表了相应的论文。 AI
影响 可能能够训练更大的模型或更有效地利用现有硬件进行 LLM 开发。
排序理由 该条目描述了一篇新的研究论文和相关的优化器代码发布。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →