llama.cpp 项目发布了多个更新,包括 b9297 版本,增加了 NVFP4 MTP 标量张量并链接了 Qwen3.5 MTP 张量。之前的版本,如 b9296 和 b9295,则侧重于 Vulkan 和其他功能的错误修复和改进。这些版本为包括 macOS、Linux、Android 和 Windows 在内的各种操作系统和硬件架构提供了预编译的二进制文件,并支持 CUDA、ROCm、Vulkan 和 SYCL 等多种计算后端。 AI
影响 llama.cpp 的持续开发为用户提供了更高效、更兼容的工具,以便在各种硬件上运行大型语言模型。
排序理由 该集群包含一个开源项目的多个发布版本,该项目提供运行大型语言模型的工具,表明其正在持续开发和更新。
AI 生成摘要 · Google Gemini · 来自 8 个来源。 我们如何撰写摘要 →