PulseAugur
EN
LIVE 15:10:57
Deutsch(DE) RT @elliotarledge: Ich habe einige sehr große Neuigkeiten... KernelBench-Hard mit H100 und B200 (Ergebnisse für einzelne GPUs). UND KernelBench-Mega, getestet a

Claude Opus 4.8 leads KernelBench-Mega benchmark, outperforming NVIDIA GPUs

A new benchmark called KernelBench-Mega has been released, which involves rewriting GPU megakernels for each generated token. The benchmark was tested on NVIDIA's RTX PRO 6000, H100, and B200 GPUs, with Claude Opus 4.8 demonstrating superior performance, achieving up to 19.4x speedup on the B200 compared to a reference. GLM-5.2 emerged as the top-performing open-weight model in this evaluation. AI

IMPACT Establishes new performance baselines for LLMs on cutting-edge NVIDIA hardware, potentially guiding future model optimization.

RANK_REASON New benchmark results published for AI models on specific GPUs. [lever_c_demoted from research: ic=1 ai=1.0]

Read on Mastodon — fosstodon.org →

AI-generated summary · Google Gemini · from 1 sources. How we write summaries →

Claude Opus 4.8 leads KernelBench-Mega benchmark, outperforming NVIDIA GPUs

COVERAGE [1]

  1. Mastodon — fosstodon.org TIER_1 Deutsch(DE) · [email protected] ·

    RT @elliotarledge: I have some very big news... KernelBench-Hard with H100 and B200 (results for single GPUs). AND KernelBench-Mega, tested a

    RT @elliotarledge: Ich habe einige sehr große Neuigkeiten... KernelBench-Hard mit H100 und B200 (Ergebnisse für einzelne GPUs). UND KernelBench-Mega, getestet auf RTX PRO 6000, H100, B200, ist endlich veröffentlicht! Bei Mega hat jedes Modell einen GPU-Megakernel (das bedeutet ei…