PulseAugur
实时 09:24:43
实体 MedMosaic

MedMosaic

PulseAugur coverage of MedMosaic — every cluster mentioning MedMosaic across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_15912 ·

    MedMosaic基准挑战AI模型在多样化医疗音频推理能力

    研究人员推出了MedMosaic,这是一个旨在评估医疗领域语言和音频推理模型的新基准数据集。该数据集包含多种类型的医疗音频和超过46,000个问答对,用于测试多跳推理和生成能力。初步评估显示,即使是像Gemini-2.5-pro这样的先进模型在医疗推理任务上也面临困难,这凸显了对更专业的多模态模型的需求。