PulseAugur
实时 04:59:49
English(EN) I Shrank a 428B Model From 855GB to 128GB and It Still Beats GPT-5.5 at Coding

压缩后的428B模型在编码基准测试中优于GPT-5.5

一个拥有4280亿参数的开放权重模型已成功从855GB压缩到128GB,同时保持了其性能。这个显著更小的模型在SWE-Bench Pro基准测试中取得了59.0%的分数,险胜GPT-5.5在该基准测试中的58.6%的分数。这一发展突显了模型压缩技术的进步,使得强大的AI模型更易于访问和高效。 AI

影响 展示了模型压缩方面的重大进展,可能使先进的AI能力更易于访问和高效。

排序理由 该条目描述了关于模型压缩和基准测试性能的研究发现,而不是来自前沿实验室的直接发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 Towards AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

压缩后的428B模型在编码基准测试中优于GPT-5.5

报道来源 [1]

  1. Towards AI TIER_1 English(EN) · Chew Loong Nian - AI ENGINEER ·

    我将一个428B模型从855GB压缩到128GB,它在编码方面仍然优于GPT-5.5

    <div class="medium-feed-item"><p class="medium-feed-snippet">A 428-billion-parameter open-weight model scores 59.0% on SWE-Bench Pro, edging out GPT-5.5&#x2019;s 58.6% &#x2014; and the community just finished&#x2026;</p><p class="medium-feed-link"><a href="https://pub.towardsai.n…