llama.cpp 项目发布了更新 B9387,其中包含对 AMD ROCm 支持的重大改进。此次更新特别启用了 MFMA(矩阵乘加)运算,但目前仅限于 AMD 的 CDNA 数据中心卡,包括 MI100、MI200 和 MI300 系列。鼓励用户分享使用此新版本的初步性能结果。 AI
影响 提高了在特定 AMD 硬件上本地 LLM 推理的性能。
排序理由 这是针对特定开源项目的软件更新,增强了硬件兼容性,属于研究/开发类别。[lever_c_demoted from research: ic=1 ai=0.7]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →