一篇新发表在arXiv上的研究论文对使用合成推理数据进行监督微调在临床预测任务中的有效性提出了质疑。研究人员发现,即使生成的推理具有医学准确性,该方法在预测阿尔茨海默病及相关痴呆症方面也会持续降低性能。研究认为,叙事合理性与判别性优化之间的冲突是根本原因,并敦促在高风险应用中更精确地理解基于推理的监督。 AI
影响 挑战了一种常见的AI训练技术在高风险临床环境中的功效,可能重定向研究方向。
排序理由 该集群包含一篇详细阐述研究结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →