PulseAugur
实时 04:54:35
中文(ZH) 硬氪专访 | 智源研究院院长王仲远:VLA不会死,但世界模型是未来

北京人工智能研究院院长:世界模型是具身智能的未来

北京人工智能研究院(BAAI)院长王仲远讨论了人工智能中的“世界模型”概念,将其与当前的大型语言模型(LLM)和视频生成模型区分开来。他概述了四种现有的世界模型方法:以语言为中心、以像素为中心、以三维结构为中心和以视觉表征为中心。BAAI正在探索第五种方法,即在统一的潜在空间表征中整合语言和视觉。王强调,真正的世界模型必须理解物理定律、因果关系和时间一致性,超越单纯的视觉真实感或令牌预测,以预测物理状态。他认为世界模型对于推进具身智能至关重要,将其比作机器人“身体”的“大脑”,并预计其发展需要数年时间。 AI

影响 世界模型有望成为下一代基础人工智能,使机器人能够理解和与物理世界互动,超越当前LLM和视频生成的能力。

排序理由 对一位杰出的AI研究人员的采访,讨论了未来AI的发展方向和概念。

在 36氪 (36Kr) 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

北京人工智能研究院院长:世界模型是具身智能的未来

报道来源 [1]

  1. 36氪 (36Kr) TIER_1 中文(ZH) ·

    Hard Science Exclusive Interview | Yuan Institute President Wang Zhongyuan: VLA will not die, but world models are the future

    <p>作者&nbsp;|&nbsp;邱晓芬</p> <p>编辑&nbsp;|&nbsp;袁斯来</p> <p>过去几个月,“世界模型”(World Model)从学术黑话迅速膨胀成AI和机器人行业里的关键词。</p> <p>行业的目光转向背后是切实的焦虑。</p> <p>一方面,经过了过去两年的野蛮生长,具身智能暴露了当前AI在物理世界中的短板——机器人能识别物体,却不懂“推杯子会掉”;能听懂指令,却无法预判“拧瓶盖需要多大的力”。世界模型正是试图补上这个短板,让机器人学会物理世界的规律、因果。</p> <p>也就是说,世界模型与具身智能的关系,本质上是…