智谱AI发布了GLM-5.2,这是一个拥有100万token上下文窗口的744B参数混合专家模型,并采用MIT许可协议发布权重。该模型在BenchLM排行榜上名列前茅,并在编码基准测试中表现强劲,使其成为可与Claude Opus 4.8和GPT-5.5等闭源模型相媲美的领先开源选项。然而,文章强调,尽管扩展的上下文窗口功能强大,但如果管理不当,可能会导致API成本显著增加,并敦促开发人员优化token使用。 AI
影响 为开源模型在编码基准测试中设定了新的SOTA(State-of-the-Art),如果管理得当,可能降低长上下文任务的成本。
排序理由 前沿实验室模型发布,带有系统卡[lever_c_demoted from frontier_release: ic=1 ai=1.0]
- BenchLM
- Claude
- Claude Opus 4.8
- FrontierSWE
- GLM-5.2
- GPT-4
- GPT-5.5
- MIT
- PostTrainBench
- SWE-bench Pro
- SWE-Marathon
- Terminal-Bench 2.1
- Zhipu AI
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →