实体 TinyLM

TinyLM

PulseAugur coverage of TinyLM — every cluster mentioning TinyLM across labs, papers, and developer communities, ranked by signal.

总计 · 30天

1

90 天内 1

发布 · 30天

0

90 天内 0

论文 · 30天

1

90 天内 1

层级分布 · 90 天

最近 · 第 1/1 页 · 共 1 条

TOOL · CL_16025 · May 5 · 04:00

TinyLM 模型在 ARC-AGI-2 视觉谜题基准测试中达到 21.7% 的准确率

研究人员开发了一种新颖的方法，使用 TinyLM（一种多视角 Transformer 模型）来应对 ARC-AGI-2 基准测试。该基准测试评估机器在人类直觉视觉解谜、泛化和规则应用方面的能力。该模型结合了测试时训练和专家产品技术，在训练集上达到了 96.1% 的准确率，在评估集上达到了 21.7% 的准确率。