PulseAugur
实时 04:39:26
实体 FlashSinkhorn

FlashSinkhorn

PulseAugur coverage of FlashSinkhorn — every cluster mentioning FlashSinkhorn across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_44971 ·

    FlashSinkhorn求解器加速GPU上的最优输运

    研究人员开发了FlashSinkhorn,一种新的GPU加速熵最优输运(EOT)求解器,可显著减少内存输入输出操作。通过重写稳定对数域Sinkhorn更新以模仿Transformer注意力中的归一化过程,FlashSinkhorn实现了融合内核,将数据流经片上SRAM。这种方法在A100 GPU上执行点云OT等任务时,与现有方法相比,前向传播速度提高了32倍,端到端速度提高了161倍。