PulseAugur
实时 06:45:21
English(EN) SurgAtlas: A Large-Scale Surgical Video-Language Dataset with 2,391 Hours of Open and Minimally Invasive Surgery

发布SurgAtlas数据集用于手术AI训练,包含2391小时视频

研究人员发布了SurgAtlas,这是一个全面的手术视频-语言理解数据集,包含超过2391小时的开放和微创手术录像。该数据集是同类中规模最大的,并且是第一个广泛涵盖开放手术过程的数据集。SurgAtlas包含多种注释,例如通过由LLM增强的自动化流程生成的片段级字幕和问答对。该数据集已被用于微调Qwen3-VL-8B模型,在既定的手术基准测试中取得了有竞争力的结果,并为先进的手术AI系统铺平了道路。 AI

影响 能够训练先进的手术基础模型和下一代多模态手术AI系统。

排序理由 该集群描述了一个新数据集及其在模型微调中的应用,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

发布SurgAtlas数据集用于手术AI训练,包含2391小时视频

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Jason J. Corso ·

    SurgAtlas: A Large-Scale Surgical Video-Language Dataset with 2,391 Hours of Open and Minimally Invasive Surgery

    We introduce SurgAtlas, the largest surgical video-language dataset to date, comprising 15,291 videos (2,391 hours) spanning 18 surgical specialties and over 5,000 procedure types, sourced entirely from publicly available YouTube content. SurgAtlas is also the first surgical vide…