PulseAugur
实时 02:05:51
English(EN) Reducing the GPU Memory Bottleneck with Lossless Compression for ML -- Extended

新的无损压缩技术加速机器学习训练和推理

研究人员开发了一种名为不变位打包 (IBP) 的新无损压缩算法,以解决机器学习中的 GPU 内存限制。IBP 识别并移除张量组中的冗余位,从而实现更快的数据传输并减少瓶颈。该方法已显示出显著的加速效果,包括 GNN 训练速度提高 74%,LLM 推理速度提高 24%,且不损失准确性。 AI

影响 减少 GPU 内存瓶颈,有可能在不牺牲准确性的情况下实现更大模型和更快的训练/推理。

排序理由 该集群包含一篇详细介绍新算法及其性能改进的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Aditya K Kamath, Arvind Krishnamurthy, Marco Canini, Simon Peter ·

    通过无损压缩减少机器学习中的 GPU 显存瓶颈 -- 扩展版

    arXiv:2605.30728v1 Announce Type: new Abstract: Machine learning (ML) training and inference often process data sets far exceeding GPU memory capacity, forcing them to rely on PCIe for on-demand tensor transfers, causing critical transfer bottlenecks. Lossy compression has been p…