PulseAugur
实时 08:19:55
实体 torch.profiler

torch.profiler

PulseAugur coverage of torch.profiler — every cluster mentioning torch.profiler across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_65011 ·

    通过优化体素化而非骨干网络来降低LiDAR检测器延迟

    研究人员在分析LiDAR物体检测器时发现,体素化和scatter-to-pillars步骤(而非3D卷积骨干网络)消耗了约40%的每帧延迟。通过将体素化过程移至GPU并优化scatter操作为一个单一的融合内核,他们将处理时间从31毫秒减少到19毫秒。这种优化主要得益于CPU和GPU工作的重叠,而不是单个内核速度的提升。在他们的自动标注循环中也发现了类似的瓶颈,通过为VLM API调用实现故障转移网关来解决。