一位用户报告称,Anthropic 的 Fable 模型在一天的内显著提高了他们内部的代理基准测试性能 23.7%。用户描述 Fable 在理解细微差别和识别错误根本原因方面能力极强,从而在代理性能方面实现了更具普遍性的改进。这一进展被强调为递归智能的潜在转折点,使模型能够通过跟踪-分析-修补-评估循环自主地改进自身。 AI
影响 展示了 AI 代理快速自我改进的潜力,加速了递归智能的发展。
排序理由 用户报告了特定模型的基准改进。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →