研究人员开发了 PicoSAM3,这是一种新的轻量级分割模型,专为在边缘设备上甚至直接在图像传感器上进行实时运行而设计。该模型拥有 130 万个参数,采用了密集 CNN 架构,并结合了感兴趣区域提示编码和来自大型模型的知识蒸馏等技术。PicoSAM3 在 COCO 和 LVIS 等基准测试中取得了出色的性能,其量化版本可以在 Sony IMX500 传感器上实现低于 12 毫秒的推理速度,满足其运行限制。 AI
影响 可在边缘设备和传感器上直接实现实时、注重隐私的视觉处理。
排序理由 该集群包含一篇详细介绍新模型及其性能基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →