研究人员开发了 Sakana Fugu,这是一系列编排器模型,旨在将多个大型语言模型 (LLM) 的专业能力结合成一个集体智能系统。这些模型本身充当语言模型,理解用户查询并动态创建代理脚手架来解决它们。这种方法使 Fugu 能够超越任何单一 LLM 代理的性能,在 SWE-Bench Pro 和 GPQA-Diamond 等具有挑战性的基准测试中取得最先进的成果。该项目发布了两个模型:Fugu(用于平衡性能和延迟)和 Fugu-Ultra(用于最大化答案质量),并详细介绍了其训练范式,包括微调、进化算法和强化学习。 AI
影响 这项研究通过有效汇集专门的 LLM 知识,可能加速复杂问题的解决进程,从而带来更强大的人工智能系统。
排序理由 该集群描述了一份技术报告,详细介绍了一种结合 LLM 能力的新型编排器模型系列,包括性能基准和训练方法。[lever_c_demoted from research: ic=1 ai=1.0]
- CharXiv Reasoning
- GPQA-Diamond
- Humanity's Last Exam
- Large Language Models
- LiveCodeBench
- Sakana Fugu
- Stefan Nielsen
- SWE-Bench Pro
- Terminal Bench
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →