llama.cpp 项目发布了多个更新,包括 b9608,该版本更新了 cpp-httplib 并为 macOS、Linux、Android 和 Windows 等各种平台提供了预编译二进制文件。b9606 版本引入了 EAGLE3 推测解码支持,增强了模型推理能力。b9605 版本包括为 Adreno GPU 添加 OpenCL 内核,提高了在某些移动设备上的性能。b9604 版本解决了 SYCL 后端的 CI 构建和发布问题,确保了更高的稳定性。 AI
影响 llama.cpp 的这些更新提高了在各种硬件上运行大型语言模型的效率和可访问性。
排序理由 这是用于运行 LLM 的工具的软件发布,而不是新的前沿模型发布或重要的研究论文。
- Adreno
- Android
- b9603
- CUDA
- Linux
- llama.cpp
- macOS
- Windows
- OpenCL
- OpenVINO
- Qualcomm
- ROCm
- Vulkan
- b9604
- b9605
- b9606
- b9608
- cpp-httplib
- EAGLE3
AI 生成摘要 · Google Gemini · 来自 5 个来源。 我们如何撰写摘要 →