研究人员开发了TRINITY,这是一种新颖的方法,使用一个0.6十亿参数的小型模型来协调多个大型前沿LLM。该协调器模型使用进化策略而非梯度下降进行训练,因为奖励稀疏,它将每个回合路由到充当思考者(Thinker)、工作者(Worker)或验证者(Verifier)的专业LLM。TRINITY在LiveCodeBench基准测试中取得了86.2%的新SOTA分数,证明了其在协调复杂LLM任务方面的有效性,而自身能力没有显著增加。该系统现已集成到Sakana的Fugu中。 AI
影响 这种方法可能带来更高效、更强大的多LLM系统,通过专业路由潜在地提高复杂任务的性能。
排序理由 该集群描述了一篇详细介绍新模型架构和基准性能的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →