PulseAugur
实时 08:45:11
English(EN) For dual GPUs, will there be any big impact to inference speeds when running in PCIe 5.0 x8/x4 vs x8/x8?

双 GPU LLM 推理:PCIe 5.0 x8/x4 与 x8/x8 的速度影响

一位 Reddit 用户正在询问 PCIe 通道配置对大型语言模型 (LLM) 双 GPU 推理速度的潜在影响。具体来说,他们担心在将模型完全加载到 VRAM 或需要部分卸载时,运行两个 GPU 的 x8/x8 配置与 x8/x4 配置之间的性能差异。该用户正在考虑添加一张 SATA 扩展卡,这将需要 x8/x4 设置。 AI

排序理由 这是一个关于 LLM 推理硬件配置的用户问题,而非新闻事件或发布。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

双 GPU LLM 推理:PCIe 5.0 x8/x4 与 x8/x8 的速度影响

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/PhantomWolf83 ·

    对于双 GPU,在 PCIe 5.0 x8/x4 与 x8/x8 下运行对推理速度会有很大影响吗?

    <!-- SC_OFF --><div class="md"><p>I bought the Biostar Z890 Valkyrie because it was on sale and had three PCIe 5.0 slots connected to the CPU (x16 or x8/x8 or x8/x4/x4), which I thought would be great for running dual GPUs for LLM inference. The problem is that now I want to add …