PulseAugur
实时 07:05:30
实体 TinyLM

TinyLM

PulseAugur coverage of TinyLM — every cluster mentioning TinyLM across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_16025 ·

    TinyLM 模型在 ARC-AGI-2 视觉谜题基准测试中达到 21.7% 的准确率

    研究人员开发了一种新颖的方法,使用 TinyLM(一种多视角 Transformer 模型)来应对 ARC-AGI-2 基准测试。该基准测试评估机器在人类直觉视觉解谜、泛化和规则应用方面的能力。该模型结合了测试时训练和专家产品技术,在训练集上达到了 96.1% 的准确率,在评估集上达到了 21.7% 的准确率。