实体
video diffusion transformer
video diffusion transformer
PulseAugur coverage of video diffusion transformer — every cluster mentioning video diffusion transformer across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
Track2View 利用3D点轨迹实现先进的相机控制视频生成
研究人员开发了Track2View,一种从新相机视角生成视频的新颖方法。该方法利用3D点轨迹建立明确的时空对应关系,确保时间连续性并提高视觉质量。Track2View 使用配对的3D点轨迹来条件化视频扩散Transformer,使其能够泛化到各种相机轨迹而无需记忆特定运动。该系统在400个视频的基准测试中展示了最先进的性能,与现有方法相比,显著降低了旋转和平移误差。
-
新AI框架增强自动驾驶场景生成
研究人员推出多个用于生成逼真且可控驾驶场景的新框架,这对于训练自动驾驶汽车至关重要。DriveWAM将视频扩散Transformer适配到自回归动作策略的创建中,整合了场景理解和记忆以实现长时规划。AnyScene提供了一个统一的以占用为中心的模型,能够从任意BEV布局进行精确控制,并生成时间上一致的多视图视频。DriveGen3D结合了高效视频扩散与3D场景重建,用于高质量、可控的动态场景,支持长驾驶视频和3D表示。此外,还策划了一…