English(EN) "Hello, World!" — A 235-Billion-Parameter Frontier Model Just Spoke on a 48 GB MacBook

235B Qwen3模型通过定制C++引擎在48GB MacBook上运行

作者 PulseAugur 编辑部 · [1 个来源] · 2026-07-02 21:44

一位开发者成功地在配备48GB内存的消费级MacBook上运行了拥有2350亿参数的Qwen3-235B-A22B-Instruct-2507模型。这是通过使用定制的C++引擎和Metal内核，并从固态硬盘流式传输模型的专家来实现的。这个过程缓慢且不完美，但它证明了大型前沿模型可以在消费级硬件上运行，挑战了它们需要庞大GPU集群的假设。一个关键的调试挑战涉及聊天模板不匹配，通过加载正确的tokenizer解决了这个问题。 AI

影响证明了大型前沿模型可以在消费级硬件上运行，可能使访问和使用更加普及。

排序理由演示了在消费级硬件上运行大型前沿模型，这是一项研究级别的成就。[lever_c_demoted from research: ic=1 ai=1.0]

在 dev.to — LLM tag 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

dev.to — LLM tag TIER_1 English(EN) · Luca Visciola · 2026-07-02 21:44

“你好，世界！”——一个拥有2350亿参数的前沿模型在48GB的MacBook上发声

<blockquote> <p><em>This is the second entry in a curious builder's diary. In <a href="https://www.linkedin.com/pulse/rock-paper-silicon-how-web-developer-used-satellite-hack-visciola-w7prf/" rel="noopener noreferrer">the first one</a>, a self-taught web developer borrowed a sate…

报道来源 [1]

“你好，世界！”——一个拥有2350亿参数的前沿模型在48GB的MacBook上发声

相关实体

相关话题