最近对十个大型语言模型的评估显示,只有 GPT-5.4 在被明确提示后能够持续提高其代码效率。虽然大多数模型在效率优先提示下显示出微小甚至负面影响,但 GPT-5.4 在配置生成和 HTML 创建等任务上取得了显著的进步。Gemma 4 31B 作为一种经济高效的替代方案脱颖而出,以低得多的成本生成自然高效的代码,而 Cohere Command A 在收到提示时效率有所下降。 AI
影响 证实了为效率进行明确提示并不能普遍改善大型语言模型的代码生成,凸显了模型特定的行为和潜在的训练不匹配。
排序理由 该集群报告了对多个大型语言模型在特定任务(代码效率)上性能的独立评估,而不是来自前沿实验室的直接发布。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →