研究人员开发了OPINE-World,这是一种新颖的LLM代理,旨在通过交互学习程序化世界模型。该系统使用两个协作代理之间的假设和测试循环来合成代码中的世界模型,然后通过反例引导的归纳合成进行细化。OPINE-World特别擅长处理像素渲染环境,能够灵活地假设对象结构,并使用一种称为本体误差的贝叶斯度量来指导探索。在ARC-AGI-3基准测试的评估中,该基准测试隐藏了对象词汇和目标语义,OPINE-World在没有针对每个游戏进行训练的情况下成功解决了25个游戏中的20个,并取得了高行动效率得分。 AI
影响 这项研究可能为AI代理带来更具数据效率和可重用性的世界模型,提高它们适应新任务和环境的能力。
排序理由 该集群描述了一篇关于新AI代理及其方法论的详细研究论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →