English(EN) Inferencing at 10.33 t/s on Qwen 3.5 35B on a $300 laptop

Qwen 3.5 35B 模型在 300 美元的笔记本电脑上以 10.33 t/s 的速度运行

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-27 19:26

Reddit 的 r/LocalLLaMA 子版块的一位用户详细介绍了他们在经济型笔记本电脑上运行 Qwen 3.5 35B 模型的体验。他们在配备 40GB RAM 的 300 美元联想 Ideapad Slim 3i 上实现了每秒 10.33 个 token 的推理速度。该设置涉及特定的优化以及使用 ik_llama.cpp 推理后端。 AI

影响证明了强大的大型语言模型可以在低成本硬件上运行，从而可能增加人工智能爱好者的可及性。

排序理由用户生成的帖子，详细介绍了特定模型在消费级硬件上的性能。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

Qwen 3.5 35B 模型在 300 美元的笔记本电脑上以 10.33 t/s 的速度运行

报道来源 [1]

r/LocalLLaMA TIER_1 English(EN) · /u/OcelotOk8071 · 2026-05-27 19:26

在300美元笔记本电脑上，Qwen 3.5 35B的推理速度达到每秒10.33万亿次

<table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tpfw50/inferencing_at_1033_ts_on_qwen_35_35b_on_a_300/"> <img alt="Inferencing at 10.33 t/s on Qwen 3.5 35B on a $300 laptop" src="https://preview.redd.it/u8062juegq3h1.png?width=140&height=75&auto=we…

报道来源 [1]

在300美元笔记本电脑上，Qwen 3.5 35B的推理速度达到每秒10.33万亿次

相关实体

相关话题