GLM-5.2 已成为上周 Fireworks AI 平台上最受欢迎的新模型。该开源模型在 GDPval-AA 基准测试中位列第三,该基准测试评估在真实世界知识工作任务上的表现。GLM-5.2 在此基准测试中也以显著优势领先所有其他开源模型。 AI
影响 GLM-5.2 在代理工作基准测试中的强劲表现可能会推动开源模型在复杂任务中的应用。
排序理由 该集群讨论了一个模型在推理平台上的受欢迎程度及其基准测试表现,这属于 AI 工具范畴,而非核心前沿发布。
在 X — Fireworks (inference infra) 阅读 →
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →