llama.cpp 的最新版本 b9788 引入了对 Intel GPU 上张量拆分的支持。此功能旨在解决之前在使用张量拆分模式时遇到的问题,特别是像 Qwen 和 Gemma 这样的模型,这些问题可能导致循环问题。开发人员正在寻求拥有双 Intel GPU 设置的用户反馈和性能数据,以评估此修复程序的有效性。 AI
影响 提高在特定硬件配置上运行大型语言模型用户的性能和稳定性。
排序理由 这是针对特定工具 llama.cpp 的软件更新,解决了特定的功能(张量拆分)和硬件兼容性(Intel GPU)。它不代表前沿发布、重大的行业举措或学术研究。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →