PulseAugur
实时 09:35:13
实体 GE scanner

GE scanner

PulseAugur coverage of GE scanner — every cluster mentioning GE scanner across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_20622 ·

    新的MRI-Eval基准显示LLM在GE扫描仪操作方面存在困难

    研究人员开发了MRI-Eval,这是一个旨在评估大型语言模型对MRI物理和GE扫描仪操作理解能力的新基准。该基准包含三个难度级别的1365个问题,结果显示,尽管模型在标准的单项选择题上表现出色,但在自由文本回忆测试中,尤其是在供应商特定的操作知识方面,其准确性显著下降。这表明在传统测试中的高分可能掩盖了实际应用中的局限性,在使用LLM输出进行关键指导时需要谨慎。