研究人员评估了GPT-4o和Gemini 2.5 Flash等大型多模态模型(LMMs)在医学影像中检测受保护健康信息(PHI)的能力。与传统OCR方法相比,LMMs在文本识别方面有所提高(词错误率降低),但这并不总是能转化为更高的整体PHI检测准确率。研究发现,LMMs在复杂印记模式上的效果最好,并为在医疗保健环境中选择和部署这些模型提供了建议。 AI
影响 LMMs在提高医学影像PHI检测方面显示出潜力,尤其是在复杂情况下,为未来的医疗保健AI部署提供指导。
排序理由 该聚类包含一篇详细介绍大型多模态模型应用研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
- Dinh Tuan Truong
- EasyOCR
- Gemini 2.5 Flash
- GPT-4o
- OCR
- Protected Health Information
- Qwen 2.5 7B
- medical images
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →