实体
b9820
b9820
PulseAugur coverage of b9820 — every cluster mentioning b9820 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
llama.cpp 更新通过减少同步来优化张量操作
llama.cpp 项目的最新更新,特别是拉取请求 #20793,为张量操作引入了显著的优化。这些更改旨在减少拆分计算期间的同步开销,特别是通过用异步副本替换同步副本来使 CUDA 后端受益。这些修改还增强了后端检测,以防止链接冲突,并允许更普遍地选择性地放宽显式同步要求,这可能使 Vulkan 等其他后端受益。
-
llama.cpp 发布多个更新,改进性能和后端 · 跟踪 9 个来源
llama.cpp 项目已发布多个更新,包括版本 b9821、b9820、b9817、b9816、b9814、b9813、b9811、b9810 和 b9804。这些版本在不同平台和后端引入了各种改进和错误修复。值得注意的更改包括对 CUDA 和 Vulkan 的优化、OpenVINO 的更新以及 Mamba2 模型实现的增强。