PulseAugur
实时 10:45:14
实体 Omni-Encoder

Omni-Encoder

PulseAugur coverage of Omni-Encoder — every cluster mentioning Omni-Encoder across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_15635 ·

    Omni-Encoder 统一视觉和音频处理,实现类人运动感知

    研究人员开发了 Omni-Encoder,这是一种新颖的 Transformer 主干网络,它统一了视觉和音频信号以实现更全面的感知。与之前分别以不同速率处理模态的 precedente 模型不同,Omni-Encoder 以对称的每秒 25 帧率共同嵌入视觉和音频数据。这种方法旨在提高对细粒度运动和跨模态交互的理解,在手语识别和体育动作分析等任务中显示出潜力。