实体
DAVIS 2017
DAVIS 2017
PulseAugur coverage of DAVIS 2017 — every cluster mentioning DAVIS 2017 across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新流程通过蒸馏扩散和MLLM实现实时视频风格化
研究人员开发了一种新的视频风格化流式处理流程,通过优化扩散U-Net和MLLM文本编码器来实现高帧率。该系统使用非对称流水线和批处理推理来克服每帧瓶颈,从而能够在消费级硬件上进行实时视频编辑。这种方法在RTX 3090 Ti上可维持超过27帧/秒的速率,在更强大的GPU上则更高,展示了高效的视频速率吞吐量。
-
小波标记统一音频、图像和视频处理
研究人员提出了一种新颖的方法,使用小波作为音频、图像和视频的通用标记方法,摆脱了特定于模态的潜在网格。他们的初步模型采用 Haar DWT/IDWT 前端和共享系数标记布局,在语音、图像和视频的基准数据集上取得了显著的 PSNR 分数。研究表明,统一的小波标记模式是可行的,进一步的实验表明稀疏训练和能量选择方法提供了有效的压缩策略。