一个优化的 ai-toolkit 分支已发布,专注于内存优化,以便在 24GB 显存下训练大多数模型而不会有性能损失。此分支支持 DoRA 和推理 LoRA,允许用户在基础模型上训练,并使用 turbo LoRA 生成样本。这些增强功能旨在使在显存较少的硬件上进行模型训练更加容易,尽管一些大型模型如 Qwen 可能仍需要 6 位训练。 AI
影响 使更多 AI 模型能在消费级硬件上训练,可能降低 AI 开发的门槛。
排序理由 这是现有工具包的一个优化分支,并非新的前沿发布或重大的行业事件。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →