研究人员开发了一个名为混合开放式三向进化(HOTE)的新框架,以提高AI代理在深度研究和自主进化方面的能力。HOTE利用混合模式强化学习,借鉴网络规模的知识,促进提案者、求解者和判断者模块之间的协作进化。实验表明,使用HOTE训练的8B模型在长篇研究任务上优于更大的静态模型和现有的深度研究方法,并且所有三个HOTE模块对其有效性都至关重要。 AI
影响 该框架能够为复杂、开放式研究任务提供更自主、更有效的AI代理。
排序理由 该集群描述了一篇关于AI代理新框架的最新研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →