一个名为Wall-OSS-0.5的开源视觉-语言-动作(VLA)模型在没有针对特定任务进行微调的情况下,在真实机器人任务上取得了显著进展。该模型在十七项任务中的四项上完成了80%以上的任务,包括拧紧可变形绳索等新颖任务。研究人员强调,该模型似乎在保持通用图像和语言理解的同时,提高了具身基础能力,这在机器人领域通常难以实现的平衡。 AI
影响 展示了在无需大量微调的情况下实现通用机器人控制的潜力,加速了具身人工智能的发展。
排序理由 发布了一个具有真实任务基准测试结果的开源模型。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →