PulseAugur
实时 10:12:46

llama.cpp b9603 发布增加了 Adreno GPU 支持和广泛的平台二进制文件

llama.cpp 项目发布了 b9603 版本,为各种平台带来了重要的更新和优化。主要改进包括通过 OpenCLAdreno GPU 添加了 Q5_0 和 Q5_1 GEMM 和 GEMV 内核,提高了高通硬件上的性能。该版本还提供了 macOSLinuxAndroidWindows 的预编译二进制文件,支持 CPU、VulkanROCmOpenVINOCUDAHIPAI

影响 优化了在各种消费级硬件和操作系统上的 AI 模型推理性能。

排序理由 这是一个开源项目的软件发布,用于优化各种硬件和平台上的 AI 模型推理,而不是一个新的前沿模型发布或重大的行业范围事件。

在 llama.cpp — Releases 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

llama.cpp b9603 发布增加了 Adreno GPU 支持和广泛的平台二进制文件

报道来源 [1]

  1. llama.cpp — Releases TIER_1 (SO) · github-actions[bot] ·

    b9603

    <details open=""> <p>opencl: add q5_0/q5_1 gemm and gemv kernels for Adreno (<a class="issue-link js-issue-link" href="https://github.com/ggml-org/llama.cpp/pull/24319">#24319</a>)</p> <ul> <li> <p>opencl: add q5_0 adreno support</p> </li> <li> <p>opencl: add q5_1 adreno support<…