PulseAugur
实时 05:54:10
English(EN) Does Language Shift Break Medical Vision-Language Models? Indonesian Radiology Visual Question Answering Case Study

医学AI模型在处理印度尼西亚放射学问题时遇到困难

一项新近发表在arXiv上的研究,调查了医学视觉语言模型(VLMs)在面对从英语到印度尼西亚语的语言转变时的表现。研究人员引入了IndoRad-VQA,一个从VQA-RAD改编而来的数据集,用于测试这些模型在印度尼西亚语下的放射学推理能力。研究结果表明,与英语提示相比,当模型使用印度尼西亚语进行提示时,性能下降了8%到25%,这突显了在医学AI领域进行更具包容性的多语言评估的迫切需求。 AI

影响 强调了需要多语言数据集,以确保医学AI在不同语言中的公平表现。

排序理由 在arXiv上发表的研究论文,详细介绍了一个新数据集和对现有模型的评估。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Pieter Christy Yan Yudhistira, Dzaki Rafif Malik, Novanto Yudistira ·

    语言转变会破坏医学视觉语言模型吗?印度尼西亚放射学视觉问答案例研究

    arXiv:2606.03693v1 Announce Type: new Abstract: Medical Vision-Language Models (VLMs) are typically evaluated on English radiology visual question answering benchmarks, leaving their robustness under non-English clinical language largely unexplored. We introduce IndoRad-VQA, an I…

  2. arXiv cs.CL TIER_1 English(EN) · Novanto Yudistira ·

    语言转变会破坏医学视觉语言模型吗?印度尼西亚放射学视觉问答案例研究

    Medical Vision-Language Models (VLMs) are typically evaluated on English radiology visual question answering benchmarks, leaving their robustness under non-English clinical language largely unexplored. We introduce IndoRad-VQA, an Indonesian adaptation of VQA-RAD, to assess wheth…