研究人员推出了一种新颖的通用医学短语定位 (GMPG) 模型 MedGrounder。这种新方法通过将句子映射到零个、一个或多个图像区域来解决现有系统的局限性,能够处理多区域发现和诸如否定等无法定位的短语。MedGrounder 采用两阶段训练过程,首先在句子-解剖框对齐上进行训练,然后在使用句子-人工标注框数据集进行微调。在 PadChest-GR 和 MS-CXR 数据集上的实验表明,它具有强大的零样本迁移能力,并且在复杂短语方面性能优于现有基线,同时需要更少的人工标注。 AI
影响 通过改进文本到图像区域的映射,增强了放射学报告的可解释性。
排序理由 介绍新模型和任务表述的学术论文。 [lever_c_demoted from research: ic=1 ai=1.0]
- Generalised Medical Phrase Grounding
- MedGrounder
- Medical Phrase Grounding
- MS-CXR
- PadChest-GR
- Referring Expression Comprehension
- Wenjun Zhang
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →