PulseAugur
实时 19:28:17
实体 MMLU-Med

MMLU-Med

PulseAugur coverage of MMLU-Med — every cluster mentioning MMLU-Med across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_06304 ·

    新的RAG方法用于医学QA,结果喜忧参半,多模态方法在大规模上优于微调

    研究人员开发了MED-VRAG,一个新颖的迭代多模态检索增强生成框架,该框架处理医学文档页面图像,包括表格和图形,而不仅仅是文本。该系统在四个医学QA基准测试中的平均准确率为78.6%,比基线高5.8个百分点,比MedRAG + GPT-4的比较高1.8个百分点。另外,一项在4B参数模型上比较领域微调与RAG在医学问答中的研究发现,微调带来了显著的6.8个百分点的准确率提升,而RAG未显示统计学上的显著改进。