r/LocalLLaMA 子版块的用户正在讨论 GLM-5.2 模型在本地运行时的性能。参与者正在分享他们的系统规格,包括硬件、量化方法和上下文大小,以及他们观察到的每秒 token 推理速度。目标是收集实际性能数据,以了解最佳配置和潜在的瓶颈。 AI
影响 提供社区驱动的关于 GLM-5.2 实际性能的见解,帮助用户进行本地部署和优化。
排序理由 用户生成关于特定模型版本的讨论和性能分享,而非官方发布或基准测试。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →