OpenAI发布了Sora,一个能够生成长达一分钟高保真视频的视频生成模型,它采用了扩散Transformer架构,将视频和图像数据处理为空时块。这种方法使Sora能够处理可变的持续时间、分辨率和宽高比,旨在创建物理世界的通用模拟器。同时,一个新的名为WorldMark的基准套件被引入,用于标准化交互式视频世界模型的评估,解决了之前不同模型之间缺乏可比指标的问题。 AI
排序理由 OpenAI发布了Sora,一个前沿的视频生成模型,并附带了一份技术报告,详细介绍了其功能。
在 Hugging Face Daily Papers 阅读 →
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →