Allen AI 推出了 MolmoMotion,这是一种新颖的模型,专为语言引导的三维运动预测而设计。该模型根据初始视频帧和对预期动作的文本描述,预测物体上点的未来三维轨迹。与现有的回顾性方法相比,MolmoMotion 通过提供更有用的前瞻性运动预测能力,旨在推进机器人规划和轨迹条件视频生成等应用。此次发布包括模型权重、一个名为 MolmoMotion-1M 的大型数据集以及一个名为 PointMotionBench 的基准测试,用于评估运动预测的准确性。 AI
影响 通过根据语言指令预测物体未来的运动,从而实现更复杂的机器人和视频生成。
排序理由 来自著名 AI 实验室的研究论文发布,详细介绍了新模型和数据集。 [lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →