研究人员开发了一个用于评估多模态大语言模型(MLLMs)在临床问答中的基准,专门针对肺栓塞(PE)风险评估。该研究使用了包含超过23,000项CTPA研究的INSPECT数据集,并制定了八项诊断和预后任务。结果表明,像Gemma4 E4B和Gemma4 E2B这样的模型在结合电子健康记录(EHR)数据和CTPA图像时表现更好,尤其是在PE诊断方面,优于再入院预测等预后任务。这表明紧凑型多模态模型在早期PE风险检测和解释方面具有强大潜力。 AI
影响 这项研究展示了多模态大语言模型在临床环境中的潜力,预示着未来在早期疾病风险检测和解释方面的应用。
排序理由 该集群包含一篇学术论文,详细介绍了用于特定临床任务的多模态大语言模型的新基准和评估。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →