一项新研究评估了一个agentic推理系统在多发性骨髓瘤管理中综合纵向临床记录的能力。该系统在与专家共识的一致性方面达到了79.6%,优于标准的检索增强生成(RAG)方法。对于复杂问题和广泛的患者病史,性能提升最为显著,但系统错误比专家分歧具有更大的临床意义。 AI
影响 展示了AI在改进复杂患者数据综合方面的潜力,但由于错误严重性,强调了仔细验证的必要性。
排序理由 学术论文,详细介绍了对AI系统临床推理能力的追溯性评估。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →