Fireworks AI 推出了其训练平台,现已支持 GLM 5.1 LoRA RL 微调。该平台提供 SFT、DPO 和完整的 RL 功能,并支持 200K 上下文窗口。用户可以使用自定义损失函数或默认设置,没有使用限制或信用限制。 AI
影响 增强了开发者的微调选项,提供了更大的灵活性,支持大上下文窗口和多种训练方法。
排序理由 这是现有平台的产品更新,并非新的前沿模型发布或重大的行业事件。
在 X — Fireworks (inference infra) 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →