PulseAugur
实时 16:54:48
实体 CUDA Graphs

CUDA Graphs

PulseAugur coverage of CUDA Graphs — every cluster mentioning CUDA Graphs across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_62734 ·

    研究发现AI推理延迟受内存带宽以外因素的限制

    一篇新论文揭示,物理AI系统(如机器人和自动驾驶汽车)的推理性能并非如先前假设的那样仅受内存带宽的限制。研究表明,虽然批处理为1的解码工作负载以内存为主,但更快的内存并不总是能带来成比例的延迟收益,尤其是在NVIDIA H100等高带宽GPU上。该研究确定了启动端开销和不同GPU架构上量化效率的变化是影响实际部署效率的关键因素。