PulseAugur
实时 14:43:49
实体 HMMT

HMMT

PulseAugur coverage of HMMT — every cluster mentioning HMMT across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_25610 ·

    研究发现 MoE 模型在复杂推理任务上错误路由 token

    研究人员发现混合专家(MoE)语言模型中存在一个重大问题,即路由机制(将 token 指向特定专家)经常选择次优路径。虽然标准路由器在置信度高的 token 上表现良好,但在复杂推理任务上却无法识别出性能更好的路径。这种错误路由存在于包括 Qwen3、GPT-OSS、DeepSeek-V2 和 OLMoE 在内的几款主流 MoE 模型中。研究表明,即使对路由器进行微小的更新,而不改变专家本身,也能提高在具有挑战性的数学和推理基准测试上…