研究人员发布了SurgAtlas,这是一个全面的手术视频-语言理解数据集,包含超过2391小时的开放和微创手术录像。该数据集是同类中规模最大的,并且是第一个广泛涵盖开放手术过程的数据集。SurgAtlas包含多种注释,例如通过由LLM增强的自动化流程生成的片段级字幕和问答对。该数据集已被用于微调Qwen3-VL-8B模型,在既定的手术基准测试中取得了有竞争力的结果,并为先进的手术AI系统铺平了道路。 AI
影响 能够训练先进的手术基础模型和下一代多模态手术AI系统。
排序理由 该集群描述了一个新数据集及其在模型微调中的应用,属于研究范畴。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →