实体
AITER v3
AITER v3
PulseAugur coverage of AITER v3 — every cluster mentioning AITER v3 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
MoonMath AI 开源 HIP Attention Kernel 以支持 AMD MI300X,性能超越 AITER v3
MoonMath AI 已开源一个用于 AMD MI300X GPU 的新型 bf16 前向注意力内核,该内核使用 HIP 编写。据报道,该内核在各种配置下均优于 AMD 自家的 AITER v3,速度提升高达 1.26 倍。性能提升归因于战略性的内存放置和一种新颖的单指令汇编包装器技术,该技术允许在利用编译器进行寄存器分配优化的同时,精确控制操作。这项进展已集成到 SGLang 中,以加速 Wan2.1 等视频扩散模型。
-
MoonMath AI 开源 AMD MI300X 注意力内核,性能优于 AITER v3 · 跟踪 3 个来源
MoonMath AI 发布了一个开源的 HIP 注意力内核,适用于 AMD 的 MI300X GPU,据报道其性能优于 AMD 自家的 AITER v3。该内核通过优化内存布局和使用单指令汇编包装器进行寄存器控制,实现了高达 1.26 倍的速度提升。此优化已集成到 SGLang 中,以加速 Wan2.1 等视频扩散模型。