PulseAugur
实时 17:43:25
English(EN) SurgLQA: Scalable Long-Horizon Surgical Video Question Answering

SurgLQA框架增强手术视频问答能力

研究人员开发了SurgLQA,一个专为长手术视频中的问答设计的新框架。该系统通过引入忠实时间整合(FTC)来保持长距离表示中的时间保真度,解决了当前专注于短片段方法的局限性。此外,它还具有时间锚定多策略缩放(TMS)功能,用于推理过程中的自适应推理。在重构的结肠镜数据集Colon-LQA和REAL-Colon-VQA基准上的实验表明,在长距离手术视频分析方面性能有所提高。 AI

影响 引入了一个新颖的远距离手术视频分析框架,可能改进临床决策支持和术中解读。

排序理由 该集群包含一篇学术论文,详细介绍了特定AI任务(手术视频问答)的新框架和方法论。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

SurgLQA框架增强手术视频问答能力

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Pheng-Ann Heng ·

    SurgLQA: Scalable Long-Horizon Surgical Video Question Answering

    Surgical Video Question Answering (VideoQA) provides a promising paradigm for dynamic intraoperative interpretation, enabling real-time decision support and context-aware retrieval in clinical environments. Nevertheless, existing approaches are predominantly restricted to images …