实体 AMD Radeon 780M

AMD Radeon 780M

PulseAugur coverage of AMD Radeon 780M — every cluster mentioning AMD Radeon 780M across labs, papers, and developer communities, ranked by signal.

总计 · 30天

2

90 天内 2

发布 · 30天

0

90 天内 0

论文 · 30天

0

90 天内 0

层级分布 · 90 天

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

TOOL · CL_102263 · Jun 21 · 03:04

集成显卡上的 LLM 面临 VRAM 限制，量化是关键

在 Intel Arc 和 AMD Radeon 780M 等集成显卡 (iGPU) 上本地运行大型语言模型 (LLM) 主要受限于 VRAM，而 VRAM 与系统 RAM 共享。虽然这些 iGPU 提供张量处理能力，但其性能受到系统内存带宽的限制。量化等技术对于适配模型至关重要，其中 Q4_K_M 是一个很好的平衡点，可以有效地运行高达 14B 参数的模型。像 Llama 3 70B 这样的大型模型，由于其高 VRAM 要求，通常无…
TOOL · CL_57479 · May 28 · 15:43

DDR5 带宽成为 AMD APU 双 LLM 推理的瓶颈

一位开发者的实验表明，AMD APU 上的 DDR5 带宽严重限制了同时运行多个大型语言模型（LLM）的性能。尽管像 Qwen 3.6:35B 这样拥有 350 亿参数的模型，在每个 token 上似乎只使用了其参数的一小部分，但其实际推理速度受到共享内存带宽的限制，使其性能与较小模型相当。这一发现导致在尝试在同一硬件上并发运行两个模型时，由于性能下降而放弃了多模型代理架构。