一项新的加速技术被开发出来,据称能使Qwen3-8B语言模型实现7.8倍的速度提升,且输出与原模型相同。另外,一个名为Sparky的完全离线行李箱机器人,使用Gemma 4 E4B模型和llama.cpp在Jetson Orin NX上构建,展示了在边缘硬件上本地部署AI的能力。此外,Intern-S2-Preview,一个35B的科学多模态模型,已在Hugging Face上发布,专注于用于本地部署的新颖“任务扩展”方法。 AI
影响 展示了本地AI推理的进步,使得在边缘设备和消费级硬件上能够实现更强大、更自主的应用。
排序理由 该集群涵盖了多个用于本地AI部署的开源模型发布和硬件项目。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →