PulseAugur
实时 08:12:05
实体 CXR-ContraBench

CXR-ContraBench

PulseAugur coverage of CXR-ContraBench — every cluster mentioning CXR-ContraBench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_22400 ·

    医学视觉语言模型难以处理否定回答,新基准揭示问题

    研究人员开发了CXR-ContraBench,这是一个新的基准,旨在评估医学视觉语言模型(VLMs)在胸部X光片分析中正确解释否定陈述方面的性能。该基准突显了一个重大问题,即模型会被否定选项所吸引,导致临床上存在风险的矛盾。虽然MedGemma和Qwen2.5-VL等模型显示出相当高的失败率,但一种名为QCCV-Neg的新方法已证明能够在不重新训练的情况下,确定性地纠正这些极性混淆的子集。