Unsloth Studeo 在笔记本电脑上运行,使用 Gemma4:e4B 模型实现了每秒 111.3 个 token 的消息计时。用户称这个以每秒 token 数衡量的性能指标“很疯狂”,并指出该网页应用程序缺乏自动语音回复是一个缺点,但对可能编写解决方案表示乐观。 AI
影响 展示了本地 AI 模型执行的具体性能基准。
排序理由 用户报告了特定模型和软件组合的性能指标。
在 Mastodon — fosstodon.org 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →