PulseAugur
实时 06:56:18

新架构学习ARC基准的可视符号规则

研究人员开发了Loop-OWM,这是一种旨在为抽象与推理语料库(ARC)学习可组合世界模型的新型架构。该面向对象的模型将规则学习为结构化视觉符号状态之间的转换,并包含颜色原型槽和演示条件任务摘要。与现有基线相比,Loop-OWM在ARC-1和ARC-2上均表现出卓越的性能,表明ARC规则可以通过视觉符号状态转换有效地学习。 AI

影响 引入了一种学习视觉符号推理的新方法,有望提高AI处理复杂规则归纳任务的能力。

排序理由 该集群包含一篇详细介绍特定基准新模型架构的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.CV 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.CV TIER_1 English(EN) · Andreas Geiger ·

    Slots, Transitions, Loops: Learning Composable World Models for ARC

    ARC tests in-context rule induction: given a few input-output demonstrations, a model must infer the hidden rule and apply it to a new query. While many approaches express ARC rules through language, code, or symbolic programs, ARC itself is visual-symbolic: rules appear as grid …