PulseAugur
实时 03:36:49
实体 TorchInductor

TorchInductor

PulseAugur coverage of TorchInductor — every cluster mentioning TorchInductor across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
最近 · 第 1/1 页 · 共 2 条
  1. RESEARCH · CL_13517 ·

    CuTeDSL成为LLM推理的新GPU内核路径,挑战CUTLASS

    LLM推理的GPU内核工程领域正在发生转变,CuTeDSL正崭露头角,有望成为C++ CuTe/CUTLASS的后继者。这种演变体现在FlashAttention-4和TorchInductor等技术中的行业趋势。对于2026年的开发者来说,选择C++ CUTLASS还是基于Python的CuTeDSL正成为一个关键考量,PyTorch和NVIDIA在其中扮演着重要角色。

  2. RESEARCH · CL_11928 ·

    GraphMend 编译器技术修复 PyTorch 2 图中断,提升性能

    研究人员开发了 GraphMend,一种旨在解决 PyTorch 2 程序中 FX 图中断问题的新型编译器技术。这些中断由动态控制流和不支持的 Python 结构引起,通常会导致性能下降和优化机会减少。GraphMend 采用源代码转换来消除这些中断,从而实现更大、不间断的计算图。在 Hugging Face 模型上的评估显示,延迟显著降低,吞吐量提高,从而提高了 PyTorch 开发者的可用性和性能。