PulseAugur
实时 12:18:13
实体 Zhihao Jia

Zhihao Jia

PulseAugur coverage of Zhihao Jia — every cluster mentioning Zhihao Jia across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_84995 ·

    MPK编译器将多GPU推理融合为单个大规模内核

    研究人员开发了MPK,一个新颖的编译器和运行时系统,旨在通过将操作转换为单个高性能的大规模内核来优化多GPU模型推理。该系统利用SM级别的图表示来实现高级优化,如跨运算符软件流水线和计算与通信的细粒度重叠。评估表明,MPK显著降低了端到端推理延迟,实现了高达1.7倍的提升,并将LLM推理性能推向更接近硬件极限的水平。