Om AI 推出了 VLX 系列模型,专为与物理世界进行实时交互而设计。与离线处理视频帧的传统模型不同,VLX 采用新颖的“流式多模态”架构,实现连续的、毫秒级的感知和行动。该系列包括用于持续环境感知的 VLX-Flow、用于精确空间定位的 VLX-Seek,以及用于将视觉理解直接转化为机器人动作的 VLX-Go。 AI
影响 为边缘设备实现实时、连续的感知和行动,可能加速具身智能的发展。
排序理由 前沿实验室模型发布,附带系统卡。[lever_c_从 frontier_release 降级:ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →