PulseAugur
实时 13:56:53
实体 PowerInfer

PowerInfer

PulseAugur coverage of PowerInfer — every cluster mentioning PowerInfer across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. COMMENTARY · CL_105452 ·

    多层MoE缓存被讨论为LLM推理的未来方向

    Reddit上的一篇讨论探讨了多层专家混合(MoE)缓存的概念,认为这是MoE模型推理的潜在未来方向。该想法涉及将模型专家策略性地分布在CPU和GPU内存中以优化性能,利用了少数专家占大部分激活的观察结果。PowerInfer和Lidenburg的llama.cpp分支等几个现有实现和研究论文被引用为该方法的示例,该方法旨在提高大型模型的推理速度,尤其是在混合RAM/VRAM设置中。