新的CUDA实现加速了GPU上的最优传输计算

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了FastSinkhorn，一种用于最优传输计算的Sinkhorn算法的新CUDA实现。该方法完全在对数域中运行，即使在其他方法失败的非常小的正则化参数下也能确保数值稳定性。基准测试表明，FastSinkhorn与POT和PyTorch等现有库相比，速度显著提升，同时使用的GPU内存最少。 AI

影响这种优化的实现可以加速依赖于最优传输的各种机器学习任务，例如图像和点云处理。

排序理由该集群包含一篇详细介绍一种新颖算法及其在最优传输中的实现的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Hao Xiao · 2026-05-05 04:00

具有 Warp 级 GPU 规约的快速对数域 Sinkhorn 最优传输

arXiv:2605.00837v1 Announce Type: new Abstract: Entropic regularized optimal transport (OT) via the Sinkhorn algorithm has become a fundamental tool in machine learning, yet existing implementations either suffer from numerical instability for small regularization parameters or i…

报道来源 [1]

具有 Warp 级 GPU 规约的快速对数域 Sinkhorn 最优传输

相关实体

相关话题