PulseAugur
实时 14:25:33
实体 Nemotron-4-340B

Nemotron-4-340B

PulseAugur coverage of Nemotron-4-340B — every cluster mentioning Nemotron-4-340B across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_96114 ·

    研究分析离散推理,揭示 GPU 饱和时的无政府状态成本

    一篇新的研究论文分析了离散推理架构,该架构将预填充和解码阶段分离到不同的 GPU 池上。该研究首次对这种设置进行了正式的博弈论分析,将其建模为涉及资源分配、缓存和请求路由的耦合博弈。研究确定了 GPU 饱和如何影响“无政府状态成本”(PoA),表明由于延迟和缓存外部性,PoA 在饱和时会显著增加。基于此,设计了一个自适应控制器来优化路由参数并改善操作点,展示了 PoA 的大幅下降,而吞吐量成本仅有轻微增加。