一位开发者找到了解决 DGX Spark GPU 在运行 Ollama 和 Qwen2.5 等大型语言模型时过热问题的变通方法。该 GPU,特别是 GB10,缺乏用户可访问的电源和风扇控制,导致在持续负载下温度约为 83°C。通过使用 `nvidia-smi --lock-gpu-clocks` 命令,开发者创建了一个守护进程,动态调整 GPU 时钟速度,将温度保持在 78°C 以下,使其稳定在 72°C。虽然此方法会略微影响推理速度,但可确保 24/7 正常运行时间和散热空间。 AI
影响 为管理 LLM 推理硬件温度提供了实用的解决方案,确保了稳定性和正常运行时间。
排序理由 开发者分享了针对特定软件硬件问题的技术解决方案。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →