研究人员开发了新的GPU内核,通过解决内存访问瓶颈来优化图神经网络(GNN)。这些内核旨在减少数据移动并提高三种主要GNN层族的局部性:基于SpMM的卷积、基于归约的聚合以及基于注意力的层。这些实现提供了显著的加速,其中一些注意力内核的性能提高了8.5倍,并大幅减少了内存占用。 AI
影响 优化的内核可以加速GNN在各种AI应用中的研究和部署。
排序理由 该集群包含一篇学术论文,详细介绍了用于提高GNN性能的新技术实现。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →