最近在 Jetson 设备上对五个小型多模态模型进行的工业边缘 AI 运行时测试发现,尽管 Gemma 4 E2B 不是最快的,但它仍然是基准模型。SmolVLM2 是最快的,但其输出过于泛泛。Qwen2.5-VL 表现强劲,尤其是在 OCR 和视觉检查任务中,使其成为一个有力的竞争者。InternVL3 在较高设置下存在上下文错误和延迟问题,而 Qwen2.5-Omni 更适合未来的音频/视频工作流。选择标准强调本地部署、结构化输出以及在提供审计跟踪和确认门的系统中的集成,Gemma 4 E2B 因其整体适用性而受到青睐。 AI
影响 边缘 AI 模型选择优先考虑系统集成和可审计性,而非原始速度,指导实际部署策略。
排序理由 文章详细介绍了针对特定边缘 AI 应用对现有多模态模型的评估,而非新模型发布或重大的行业范围内的发展。
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →