NVIDIA发布了SANA-WM,这是一个拥有26亿参数的开源世界模型,旨在在单个GPU上生成分钟级、720p的视频。该模型解决了以往视频生成在计算资源需求或分辨率方面的限制。SANA-WM采用了一种新颖的混合线性注意力(hybrid linear attention)和Gated DeltaNet架构,实现了高效、高质量的视频合成,是具身智能(embodied AI)和机器人研究的重大进展。 AI
影响 能够在单个GPU上生成高质量、分钟级的视频,有望加速具身智能、仿真和机器人领域的研究和应用。
排序理由 NVIDIA发布了SANA-WM,一个具有详细技术规格和性能声明的新型开源世界模型。
AI 生成摘要 · Google Gemini · 来自 8 个来源。 我们如何撰写摘要 →