English(EN) I Tested ZAYA1-8B — Trained on Zero NVIDIA GPUs, Its 760M Active Params Cheated GPT-5-High on Math

Zaya1-8B 模型在数学测试中不使用 NVIDIA GPU 击败 GPT-5-High

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-19 05:39

一款名为 Zaya1-8B 的新语言模型，采用混合专家（Mixture-of-Experts）架构，拥有 7.6 亿活跃参数，在 HMMT '25 数学竞赛中展现出令人印象深刻的性能。值得注意的是，该模型在没有任何 NVIDIA GPU 训练的情况下取得了这些成果，这与典型的高性能人工智能训练方式显著不同。Zaya1-8B 在此特定数学基准测试中超越了 GPT-5-High 的表现，得分 89.6%。 AI

影响展示了新颖的训练方法可以产生有竞争力的结果，有可能减少对昂贵 GPU 基础设施的依赖。

排序理由该集群报告了一个新模型在特定基准测试上的表现，属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 Towards AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

Towards AI TIER_1 English(EN) · Chew Loong Nian - AI ENGINEER · 2026-05-19 05:39

我测试了 ZAYA1-8B — 零 NVIDIA GPU 训练，其 7.6 亿活跃参数在数学上欺骗了 GPT-5-High

<div class="medium-feed-item"><p class="medium-feed-snippet">A 760-million-active-parameter MoE that never touched a single NVIDIA H100 in training scored 89.6% on HMMT ’25 math — 1.3 points higher…</p><p class="medium-feed-link"><a href="https://pub.towardsa…

报道来源 [1]

我测试了 ZAYA1-8B — 零 NVIDIA GPU 训练，其 7.6 亿活跃参数在数学上欺骗了 GPT-5-High

相关实体

相关话题