PulseAugur
实时 01:02:48
English(EN) DGX Spark hitting 83 C under sustained Ollama load — solved by clock-locking via nvidia-smi -lgc

DGX Spark GPU 过热问题通过 nvidia-smi 时钟锁定解决

一位开发者找到了解决 DGX Spark GPU 在运行 OllamaQwen2.5 等大型语言模型时过热问题的变通方法。该 GPU,特别是 GB10,缺乏用户可访问的电源和风扇控制,导致在持续负载下温度约为 83°C。通过使用 `nvidia-smi --lock-gpu-clocks` 命令,开发者创建了一个守护进程,动态调整 GPU 时钟速度,将温度保持在 78°C 以下,使其稳定在 72°C。虽然此方法会略微影响推理速度,但可确保 24/7 正常运行时间和散热空间。 AI

影响 为管理 LLM 推理硬件温度提供了实用的解决方案,确保了稳定性和正常运行时间。

排序理由 开发者分享了针对特定软件硬件问题的技术解决方案。

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

DGX Spark GPU 过热问题通过 nvidia-smi 时钟锁定解决

报道来源 [1]

  1. dev.to — LLM tag TIER_1 English(EN) · Deal Estate ·

    DGX Spark 在持续 Ollama 负载下达到 83°C — 通过 nvidia-smi 的 clock-locking 解决 -lgc

    <h1> DGX Spark hitting 83°C under sustained Ollama load — solved by clock-locking via nvidia-smi -lgc </h1> <p><strong>TL;DR:</strong> GB10 in the DGX Spark has no user-exposed power-limit or fan-curve control (<code>nvidia-smi</code> returns <code>[N/A]</code> for both — firmwar…