实体 video diffusion transformer

video diffusion transformer

PulseAugur coverage of video diffusion transformer — every cluster mentioning video diffusion transformer across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 2

发布 · 30天

90 天内 0

论文 · 30天

90 天内 2

层级分布 · 90 天

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条

RESEARCH · CL_93922 · Jun 14 · 00:00

Track2View 利用3D点轨迹实现先进的相机控制视频生成

研究人员开发了Track2View，一种从新相机视角生成视频的新颖方法。该方法利用3D点轨迹建立明确的时空对应关系，确保时间连续性并提高视觉质量。Track2View 使用配对的3D点轨迹来条件化视频扩散Transformer，使其能够泛化到各种相机轨迹而无需记忆特定运动。该系统在400个视频的基准测试中展示了最先进的性能，与现有方法相比，显著降低了旋转和平移误差。
RESEARCH · CL_50748 · May 25 · 17:59

新AI框架增强自动驾驶场景生成

研究人员推出多个用于生成逼真且可控驾驶场景的新框架，这对于训练自动驾驶汽车至关重要。DriveWAM将视频扩散Transformer适配到自回归动作策略的创建中，整合了场景理解和记忆以实现长时规划。AnyScene提供了一个统一的以占用为中心的模型，能够从任意BEV布局进行精确控制，并生成时间上一致的多视图视频。DriveGen3D结合了高效视频扩散与3D场景重建，用于高质量、可控的动态场景，支持长驾驶视频和3D表示。此外，还策划了一…

Track2View 利用3D点轨迹实现先进的相机控制视频生成

新AI框架增强自动驾驶场景生成