PulseAugur
实时 19:17:31
English(EN) Event-to-Video Reconstruction using Spatio-Temporal and Frequency-Enhanced Deep Neural Networks

新的Transformer模型提升事件到视频重建质量

研究人员开发了一种名为MSFET-E2V的新模型用于事件到视频重建,旨在将事件相机产生的异步事件流转换为密集的视频帧。这种新颖的多尺度频率增强Transformer模型利用跨域注意力模块,融合了时空特征和从离散小波变换获得的频率感知表示。该方法通过考虑低频和高频分量来增强细节保留和鲁棒性,并包含一个用于伪影抑制的小波增强跳跃块。实验表明,MSFET-E2V在重建质量上优于现有的最先进方法,同时还减少了参数、内存使用和推理时间。 AI

影响 这个新模型为将事件相机数据转换为可用视频提供了更高的效率和质量,可能使需要高速和高动态范围成像的应用受益。

排序理由 该集群包含一篇详细介绍用于特定计算机视觉任务的新型深度神经网络模型的学术论文。

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的Transformer模型提升事件到视频重建质量

报道来源 [2]

  1. arXiv cs.CV TIER_1 English(EN) · Ramna Maqsood, Paulo Nunes, Lu\'is Ducla Soares, Caroline Conti ·

    使用时空和频率增强的深度神经网络进行事件到视频重建

    arXiv:2605.25804v1 Announce Type: new Abstract: Event cameras offer significant advantages over conventional frame-based counterparts, including high temporal resolution, low latency, and energy efficiency. These characteristics make them suitable for high-speed and high-dynamic …

  2. arXiv cs.CV TIER_1 English(EN) · Caroline Conti ·

    使用时空和频率增强的深度神经网络进行事件到视频重建

    Event cameras offer significant advantages over conventional frame-based counterparts, including high temporal resolution, low latency, and energy efficiency. These characteristics make them suitable for high-speed and high-dynamic range scene acquisition scenarios; however, the …