一项名为 KernelBench-Mega 的新基准测试已发布,该测试涉及为每个生成的 token 重写 GPU megakernels。该基准测试在 NVIDIA 的 RTX PRO 6000、H100 和 B200 GPU 上进行了测试,Claude Opus 4.8 表现出卓越的性能,在 B200 上相比参考模型速度提升高达 19.4 倍。GLM-5.2 在此次评估中成为性能最佳的开源模型。 AI
影响 为 LLM 在最先进的 NVIDIA 硬件上建立了新的性能基线,可能指导未来的模型优化。
排序理由 发布了特定 GPU 上 AI 模型的新基准测试结果。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — fosstodon.org 阅读 →
- Claude Opus 4.8
- GLM-5.2
- KernelBench-Hard
- KernelBench-Mega
- NVIDIA AI
- Nvidia B200
- NVIDIA H100
- RTX PRO 6000
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →