研究人员开发了一个自动化流程,用于创建基准,以评估视觉-语言模型(VLMs)在3D医学影像(特别是肿瘤学领域)上的表现。该流程直接从放射学报告和3D扫描生成问答数据集,产生模式衍生和LLM生成的两种问题。在四个癌症队列上的评估显示,目前没有单一的VLM占主导地位,并且模型的表现因数据集而异,一些模型在某些扫描上的表现甚至优于(或不亚于)在不看图像的情况下进行评估的模型。 AI
影响 该基准旨在改善医学影像中VLM的评估,可能带来更可靠的诊断和治疗规划AI工具。
排序理由 该集群描述了一篇介绍AI模型评估基准的新学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →