一项新近发表在arXiv上的研究,调查了医学视觉语言模型(VLMs)在面对从英语到印度尼西亚语的语言转变时的表现。研究人员引入了IndoRad-VQA,一个从VQA-RAD改编而来的数据集,用于测试这些模型在印度尼西亚语下的放射学推理能力。研究结果表明,与英语提示相比,当模型使用印度尼西亚语进行提示时,性能下降了8%到25%,这突显了在医学AI领域进行更具包容性的多语言评估的迫切需求。 AI
影响 强调了需要多语言数据集,以确保医学AI在不同语言中的公平表现。
排序理由 在arXiv上发表的研究论文,详细介绍了一个新数据集和对现有模型的评估。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →