Qualcomm推出了GenieX,这是一个新的SDK,旨在促进大型语言模型(LLM)在Windows笔记本上的运行。早期性能测试显示速度令人鼓舞,在使用笔记本的GPU或NPU时,Gemma 4 26B达到了20 tokens/sec,Qwen 3.6 27B达到了10 tokens/sec。该平台还支持通过llama.cpp运行模型,为各种GGUF模型提供CPU、GPU和NPU加速。 AI
影响 使得LLM能够更广泛地部署在消费级硬件上,可能提高可访问性和本地处理能力。
排序理由 这是一个面向SDK的产品发布,该SDK支持在消费级硬件上执行AI模型,属于“工具”类别。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →