Fireworks AI 推出了新功能,支持对 NVIDIA 的 Nemotron 3 模型进行强化学习 (RL) 微调,首批支持 Nemotron 3 Super,并使用 LoRA 和 GRPO 方法。这个集成平台允许用户在同一地点训练和部署模型,定价基于 GPU 小时使用量而非 token 数量,以管理长时间交互的成本。 AI
影响 此次集成简化了特定 NVIDIA 模型的微调过程,可能降低了开发人员定制和部署这些模型的门槛。
排序理由 这是现有模型的新功能发布,而非前沿模型发布。
在 X — Fireworks (inference infra) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →