English(EN) Sound Source Localization for Spatial Mapping of Surgical Actions in Dynamic Scenes

研究人员将声音定位与视觉数据相结合，以实现手术场景理解

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-05 04:00

研究人员开发了一个新颖的框架，将3D声学信息与视觉数据相结合，以创建增强的手术场景表示。该方法使用相控麦克风阵列在空间中定位声音事件，并将此数据投影到来自RGB-D摄像机的动态点云上。一个基于Transformer的模块识别相关的声学事件，从而能够更全面、更具上下文感知地理解手术活动，为未来智能手术系统提供支持。 AI

影响引入了一种新的多模态手术场景理解方法，有可能实现更先进的AI驱动的手术辅助。

排序理由这是一篇详细介绍新颖手术场景理解框架的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Jonas Hein, Lazaros Vlachopoulos, Maurits Geert Laurent Olthof, Bastian Sigrist, Philipp F\"urnstahl, Matthias Seibold · 2026-05-05 04:00

用于动态场景中手术动作空间映射的声音源定位

arXiv:2510.24332v3 Announce Type: replace-cross Abstract: Purpose: Surgical scene understanding is key to advancing computer-aided and intelligent surgical systems. Current approaches predominantly rely on visual data or end-to-end learning, which limits fine-grained contextual m…

报道来源 [1]

用于动态场景中手术动作空间映射的声音源定位

相关实体

相关话题