一位用户在 r/LocalLLaMA 上分享了关于本地 LLM 在编码任务方面进行比较的令人惊讶的轶事结果。他们发现 Google 的 Gemma 4 31B 模型在理解代码相互依赖关系和进行上下文感知修改方面比预期的要好得多,在他们的特定用例中,其表现优于 Qwen 3.6 甚至 Anthropic 的 Claude Opus 4.7 等模型。用户指出,虽然 Qwen 模型在提出更改方面更为激进,但 Gemma 4 31B 对代码某一部分的更改将如何影响其他部分有了更深刻的理解,这对于重构混乱的学术代码至关重要。 AI
影响 表明 Gemma 4 31B 可能在复杂代码重构方面表现出色,挑战了现有的性能认知。
排序理由 关于模型性能的用户轶事,而非正式发布或基准测试。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →