PulseAugur
实时 23:37:15
English(EN) MolmoMotion: Language-guided 3D motion forecasting

Allen AI 发布 MolmoMotion,用于语言引导的三维运动预测

Allen AI 推出了 MolmoMotion,这是一种新颖的模型,专为语言引导的三维运动预测而设计。该模型根据初始视频帧和对预期动作的文本描述,预测物体上点的未来三维轨迹。与现有的回顾性方法相比,MolmoMotion 通过提供更有用的前瞻性运动预测能力,旨在推进机器人规划和轨迹条件视频生成等应用。此次发布包括模型权重、一个名为 MolmoMotion-1M 的大型数据集以及一个名为 PointMotionBench 的基准测试,用于评估运动预测的准确性。 AI

影响 通过根据语言指令预测物体未来的运动,从而实现更复杂的机器人和视频生成。

排序理由 来自著名 AI 实验室的研究论文发布,详细介绍了新模型和数据集。 [lever_c_demoted from research: ic=1 ai=1.0]

在 Hugging Face Blog 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. Hugging Face Blog TIER_1 English(EN) ·

    MolmoMotion: Language-guided 3D motion forecasting