English(EN) I scaled test-time compute for Qwen-3.6-27B and Gemma-4-31B to surpass Claude Mythos in code optimizations and speedups.

Qwen 和 Gemma 模型通过扩展测试时计算量得到提升

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-12 20:55

Reddit 的 r/LocalLLaMA 子版块上一位用户详细介绍了一种扩展测试时计算量的方法，以提高 Qwen-3.6-27B 和 Gemma-4-31B 模型的性能。该方法涉及显著增加基线模型的计算使用量，以改进代码优化和加速，目标是超越现有基准。所描述的脚手架利用了广泛的探索广度、迭代校正和假设检验，并设有解决方案池以防止局部最小值。然而，用户指出，由于处理长上下文窗口的限制，Qwen 和 Gemma 模型在后续迭代中都出现了性能回归。 AI

影响展示了一种通过扩展测试时计算量来增强 LLM 性能的新颖方法，有望改进代码优化和速度。

排序理由该集群描述了一种用户实现的改进现有模型的研发方法，而非前沿实验室的发布。[lever_c_demoted from research: ic=1 ai=1.0]

在 r/LocalLLaMA 阅读 →

模型发布

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/Ryoiki-Tokuiten · 2026-06-12 20:55

我将 Qwen-3.6-27B 和 Gemma-4-31B 的测试时间计算量提升至超越 Claude Mythos，在代码优化和加速方面取得突破。

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1u47cvc/i_scaled_testtime_compute_for_qwen3627b_and/"> <img alt="I scaled test-time compute for Qwen-3.6-27B and Gemma-4-31B to surpass Claude Mythos in code optimizations and speedups." src="https://preview.r…

报道来源 [1]

我将 Qwen-3.6-27B 和 Gemma-4-31B 的测试时间计算量提升至超越 Claude Mythos，在代码优化和加速方面取得突破。

相关实体

相关话题