English(EN) SurgLQA: Scalable Long-Horizon Surgical Video Question Answering

SurgLQA框架增强手术视频问答能力

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-18 06:24

研究人员开发了SurgLQA，一个专为长手术视频中的问答设计的新框架。该系统通过引入忠实时间整合（FTC）来保持长距离表示中的时间保真度，解决了当前专注于短片段方法的局限性。此外，它还具有时间锚定多策略缩放（TMS）功能，用于推理过程中的自适应推理。在重构的结肠镜数据集Colon-LQA和REAL-Colon-VQA基准上的实验表明，在长距离手术视频分析方面性能有所提高。 AI

影响引入了一个新颖的远距离手术视频分析框架，可能改进临床决策支持和术中解读。

排序理由该集群包含一篇学术论文，详细介绍了特定AI任务（手术视频问答）的新框架和方法论。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CV TIER_1 English(EN) · Pheng-Ann Heng · 2026-05-18 06:24

SurgLQA: Scalable Long-Horizon Surgical Video Question Answering

Surgical Video Question Answering (VideoQA) provides a promising paradigm for dynamic intraoperative interpretation, enabling real-time decision support and context-aware retrieval in clinical environments. Nevertheless, existing approaches are predominantly restricted to images …

报道来源 [1]

SurgLQA: Scalable Long-Horizon Surgical Video Question Answering

相关实体

相关话题