实体
AMD Radeon 780M
AMD Radeon 780M
PulseAugur coverage of AMD Radeon 780M — every cluster mentioning AMD Radeon 780M across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
集成显卡上的 LLM 面临 VRAM 限制,量化是关键
在 Intel Arc 和 AMD Radeon 780M 等集成显卡 (iGPU) 上本地运行大型语言模型 (LLM) 主要受限于 VRAM,而 VRAM 与系统 RAM 共享。虽然这些 iGPU 提供张量处理能力,但其性能受到系统内存带宽的限制。量化等技术对于适配模型至关重要,其中 Q4_K_M 是一个很好的平衡点,可以有效地运行高达 14B 参数的模型。像 Llama 3 70B 这样的大型模型,由于其高 VRAM 要求,通常无…
-
DDR5 带宽成为 AMD APU 双 LLM 推理的瓶颈
一位开发者的实验表明,AMD APU 上的 DDR5 带宽严重限制了同时运行多个大型语言模型(LLM)的性能。尽管像 Qwen 3.6:35B 这样拥有 350 亿参数的模型,在每个 token 上似乎只使用了其参数的一小部分,但其实际推理速度受到共享内存带宽的限制,使其性能与较小模型相当。这一发现导致在尝试在同一硬件上并发运行两个模型时,由于性能下降而放弃了多模型代理架构。