PulseAugur
实时 12:11:09
实体 EHRNote-ChatQA

EHRNote-ChatQA

PulseAugur coverage of EHRNote-ChatQA — every cluster mentioning EHRNote-ChatQA across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_93309 ·

    新基准测试 LLM 的多轮临床问答能力

    研究人员推出了 EHRNote-ChatQA,这是一个新颖的基准,旨在评估纵向患者出院总结的多轮临床问答能力。该基准源自已去标识化的 MIMIC-IV 数据,包含 967 个患者样本中的 16,000 多个专家验证的问答对。对 22 个 LLM 的初步评估表明,在证据支持和多轮错误累积方面存在显著挑战,这表明在单轮临床问答中的表现不能可靠地转化为这种更复杂的场景。