PulseAugur
实时 01:01:48
English(EN) Inferencing at 10.33 t/s on Qwen 3.5 35B on a $300 laptop

Qwen 3.5 35B 模型在 300 美元的笔记本电脑上以 10.33 t/s 的速度运行

Reddit 的 r/LocalLLaMA 子版块的一位用户详细介绍了他们在经济型笔记本电脑上运行 Qwen 3.5 35B 模型的体验。他们在配备 40GB RAM 的 300 美元联想 Ideapad Slim 3i 上实现了每秒 10.33 个 token 的推理速度。该设置涉及特定的优化以及使用 ik_llama.cpp 推理后端。 AI

影响 证明了强大的大型语言模型可以在低成本硬件上运行,从而可能增加人工智能爱好者的可及性。

排序理由 用户生成的帖子,详细介绍了特定模型在消费级硬件上的性能。

在 r/LocalLLaMA 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

Qwen 3.5 35B 模型在 300 美元的笔记本电脑上以 10.33 t/s 的速度运行

报道来源 [1]

  1. r/LocalLLaMA TIER_1 English(EN) · /u/OcelotOk8071 ·

    在300美元笔记本电脑上,Qwen 3.5 35B的推理速度达到每秒10.33万亿次

    <table> <tr><td> <a href="https://www.reddit.com/r/LocalLLaMA/comments/1tpfw50/inferencing_at_1033_ts_on_qwen_35_35b_on_a_300/"> <img alt="Inferencing at 10.33 t/s on Qwen 3.5 35B on a $300 laptop" src="https://preview.redd.it/u8062juegq3h1.png?width=140&amp;height=75&amp;auto=we…