新方法在不牺牲稳定性的情况下增强了LLM推理的多样性

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-04 04:00

研究人员推出了一种名为Expert-Sample的新型无训练方法，旨在增强细粒度混合专家（MoE）模型的性能。该技术通过分析MoE层的路由分数来解决测试时扩展的性能与多样性和稳定性之间的权衡问题。Expert-Sample利用了MoE路由器表现出高置信度“确定头”和低置信度“不确定尾”的观察结果，选择性地将随机性注入后者，以提高生成多样性而不损害输出稳定性。该方法在Qwen3-30B-A3B-Instruct等模型上的评估显示，在各种推理和编码任务上，准确性和pass@n指标均得到了一致的改进。 AI

影响引入了一种无训练方法，可提高MoE模型在推理和编码任务上的多样性和准确性。

排序理由这是一篇研究论文，详细介绍了一种改进MoE模型性能的新方法。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Yuanteng Chen, Peisong Wang, Nanxin Zeng, Yuantian Shao, Shuang Qiu, Gang Li, Jing Liu, Jian Cheng · 2026-05-04 04:00

特定头部，不确定尾部：细粒度MoE测试时域的专家采样

arXiv:2602.02443v2 Announce Type: replace Abstract: Test-time scaling improves LLM performance by generating multiple candidate solutions, yet token-level sampling requires temperature tuning that trades off diversity against stability. Fine-grained MoE, featuring hundreds of wel…

报道来源 [1]

特定头部，不确定尾部：细粒度MoE测试时域的专家采样

相关实体

相关话题