PulseAugur
实时 11:04:39
实体 Hessian-Aware Router Calibration (HARC)

Hessian-Aware Router Calibration (HARC)

PulseAugur coverage of Hessian-Aware Router Calibration (HARC) — every cluster mentioning Hessian-Aware Router Calibration (HARC) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_68187 ·

    新方法校准 MoE 模型合并以修复路由中断

    研究人员发现,在合并专家混合(MoE)大型语言模型时存在一个重大问题,称为“路由中断”。当合并过程破坏 MoE 路由器的能力,使其无法将 token 正确导向相应的专家模型时,就会发生这种情况,从而导致性能下降。为了解决这个问题,他们提出了 Hessian-Aware Router Calibration (HARC),这是一种新颖的无训练方法,利用二阶曲率信息来重新校准路由器。实验表明,HARC 在数学推理和代码生成等任务上能有效提高性能。