一位 Reddit 用户正在询问 PCIe 通道配置对大型语言模型 (LLM) 双 GPU 推理速度的潜在影响。具体来说,他们担心在将模型完全加载到 VRAM 或需要部分卸载时,运行两个 GPU 的 x8/x8 配置与 x8/x4 配置之间的性能差异。该用户正在考虑添加一张 SATA 扩展卡,这将需要 x8/x4 设置。 AI
排序理由 这是一个关于 LLM 推理硬件配置的用户问题,而非新闻事件或发布。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →