PulseAugur
实时 03:33:36
实体 CUDA Kernels

CUDA Kernels

PulseAugur coverage of CUDA Kernels — every cluster mentioning CUDA Kernels across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_26186 ·

    Sakana AI、NVIDIA 发布 TwELL,加速 LLM 训练和推理

    Sakana AI 和 NVIDIA 的研究人员开发了 TwELL,这是一种显著加速大型语言模型 (LLM) 操作的新方法。通过针对计算密集型的前馈层,TwELL 实现了高稀疏性,并在 GPU 上转化为实际性能提升。该方法在不影响模型准确性的情况下,训练速度最高提升 21.9%,推理速度最高提升 20.5%。