PulseAugur
实时 13:15:03
English(EN) Are LLMs Ready to Assist Physicians? PhysAssistBench for Interactive Doctor-Patient-EHR Assistance

新基准显示大型语言模型在交互式医生辅助方面存在困难

研究人员开发了 PhysAssistBench,这是一个旨在评估大型语言模型 (LLM) 在协助医生方面的能力的新基准。该基准侧重于涉及医生、患者和电子健康记录 (EHR) 的交互式场景,要求 LLM 协调临床知识、沟通和系统交互。PhysAssistBench 使用 MIMIC-IV 的真实案例构建,包含一个由 1,296 个医生验证的轮次组成的数据集。初步实验表明,当前 LLM 在此复杂的临床辅助角色中尚不可靠,凸显了更好地整合这些不同能力的需求。 AI

影响 强调了 LLM 在真实临床辅助能力方面存在的关键差距,表明需要进一步开发才能可靠地集成到医疗工作流程中。

排序理由 该集群包含一篇介绍用于在特定领域评估 LLM 的新基准的研究论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.AI TIER_1 English(EN) · Tianming Du, Peijie Yu, Sihan Shang, Danli Shi, My Linh Nguyen, Shengbo Gao, Guangyuan Li, Yinghong Yu, Yan Jiang, Qianlong Zhao, Behzad Bozorgtabar, Shaoxiong Ji, Jiazhen Pan, Daniel Rueckert, Jiancheng Yang ·

    Are LLMs Ready to Assist Physicians? PhysAssistBench for Interactive Doctor-Patient-EHR Assistance

    arXiv:2606.18613v1 Announce Type: cross Abstract: The most plausible near-term role of medical LLMs is to assist rather than replace physicians, yet current evaluations often test isolated capabilities: clinical knowledge, EHR system interaction, or patient communication. Physici…

  2. arXiv cs.CL TIER_1 English(EN) · Jiancheng Yang ·

    Are LLMs Ready to Assist Physicians? PhysAssistBench for Interactive Doctor-Patient-EHR Assistance

    The most plausible near-term role of medical LLMs is to assist rather than replace physicians, yet current evaluations often test isolated capabilities: clinical knowledge, EHR system interaction, or patient communication. Physician assistance instead requires coordinating these …