一位用户已成功配置 Jetson Orin NX 以运行 Hermes Agent,并取得了令人印象深刻的性能指标。该配置优先考虑静音和美观,同时在文本生成方面实现了超过 10 token/秒,在提示处理方面实现了 300 token/秒。该设置支持至少 65,000 token 的上下文窗口,具体测试显示 Gemma 4 26B 模型在 60,000 token 上下文下实现了 10.21 token/秒。 AI
影响 展示了在紧凑型硬件上高效部署本地 LLM 的能力,实现了高级代理功能。
排序理由 用户驱动的特定 AI Agent 的硬件和软件配置。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →