PulseAugur
实时 12:51:00
English(EN) Sound Source Localization for Spatial Mapping of Surgical Actions in Dynamic Scenes

研究人员将声音定位与视觉数据相结合,以实现手术场景理解

研究人员开发了一个新颖的框架,将3D声学信息与视觉数据相结合,以创建增强的手术场景表示。该方法使用相控麦克风阵列在空间中定位声音事件,并将此数据投影到来自RGB-D摄像机的动态点云上。一个基于Transformer的模块识别相关的声学事件,从而能够更全面、更具上下文感知地理解手术活动,为未来智能手术系统提供支持。 AI

影响 引入了一种新的多模态手术场景理解方法,有可能实现更先进的AI驱动的手术辅助。

排序理由 这是一篇详细介绍新颖手术场景理解框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

研究人员将声音定位与视觉数据相结合,以实现手术场景理解

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Jonas Hein, Lazaros Vlachopoulos, Maurits Geert Laurent Olthof, Bastian Sigrist, Philipp F\"urnstahl, Matthias Seibold ·

    用于动态场景中手术动作空间映射的声音源定位

    arXiv:2510.24332v3 Announce Type: replace-cross Abstract: Purpose: Surgical scene understanding is key to advancing computer-aided and intelligent surgical systems. Current approaches predominantly rely on visual data or end-to-end learning, which limits fine-grained contextual m…