PulseAugur
实时 16:29:37
实体 TensorDock

TensorDock

PulseAugur coverage of TensorDock — every cluster mentioning TensorDock across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_91923 ·

    混合MoE LLM在全通信中显示隐藏延迟

    新的混合Mamba-Transformer专家混合(MoE)模型,例如NVIDIA的Nemotron 3 Nano Omni和Jamba,正在表现出性能停顿,而这些停顿在标准的推理仪表板中是看不见的。这些停顿发生在MoE路由层内的全通信过程中,尽管它们占总调用次数的比例较小,但却主导了尾部延迟。当前的指标,如GPU利用率和端到端延迟,会聚合这些问题,掩盖了对优化推理引擎至关重要的每层性能变化。