研究人员推出 Incantation,这是一种新颖的交互式视频世界模型,它使用自然语言作为其主要的动作接口。这种方法可以对视频模拟中的多个实体进行细粒度控制,并实现跨实体泛化,克服了先前控制协议的局限性。与现有基线相比,该模型在处理词汇外提示和跨实体转移方面表现出显著的改进,同时还实现了实时性能。 AI
影响 能够更直观、更灵活地控制复杂的模拟环境,可能推动人工智能驱动的内容创建和交互式模拟。
排序理由 该集群包含一篇详细介绍新模型及其功能的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →