PulseAugur
实时 09:18:54
实体 GPT5-mini

GPT5-mini

PulseAugur coverage of GPT5-mini — every cluster mentioning GPT5-mini across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_68275 ·

    新的基准揭示了 LLM 在动态临床决策中的局限性

    研究人员开发了新的基准来评估大型语言模型 (LLM) 在动态临床决策场景中的能力。MedSP1000 源自标准化患者案例,评估 LLM 随时间管理患者护理的能力,显示即使是 GPT-5.5 等顶级模型也只能满足专家标准的约 60%。同样,多模态 LLM BreastGPT 在 BreastStage-Bench 上针对乳腺癌护理进行了评估,显示出潜力但突出了对与工作流程一致的数据的需求。ClinicalMC 为多疗程临床决策提供了另一…