PulseAugur
实时 11:48:25
English(EN) We Asked 10 LLMs to Write Efficient Code. Only 4 Got Better.

GPT-5.4 在高效代码生成方面领先大型语言模型,Gemma 4 具有性价比

最近对十个大型语言模型的评估显示,只有 GPT-5.4 在被明确提示后能够持续提高其代码效率。虽然大多数模型在效率优先提示下显示出微小甚至负面影响,但 GPT-5.4 在配置生成和 HTML 创建等任务上取得了显著的进步。Gemma 4 31B 作为一种经济高效的替代方案脱颖而出,以低得多的成本生成自然高效的代码,而 Cohere Command A 在收到提示时效率有所下降。 AI

影响 证实了为效率进行明确提示并不能普遍改善大型语言模型的代码生成,凸显了模型特定的行为和潜在的训练不匹配。

排序理由 该集群报告了对多个大型语言模型在特定任务(代码效率)上性能的独立评估,而不是来自前沿实验室的直接发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Vilius ·

    我们让10款大语言模型编写高效代码。只有4款表现更好。

    <p><em>By Vilius Vystartas | May 2026</em></p> <p>Every LLM can write code that works. The question is: can they write code that's <em>efficient</em> — and does telling them to be efficient actually help?</p> <p>I tested 10 models on 10 coding tasks, each in two phases: <strong>u…