人工智能初创公司Poetiq开发了一个自优化系统,在编码和ARC-AGI基准测试中取得了新的最先进性能。该系统利用谷歌的Gemini 3 Flash模型,在这些评估中超越了Anthropic的Claude Opus 4.7。这种递归自我改进技术代表了人工智能推理效率的重大进步。 AI
影响 在编码和ARC-AGI基准测试中设定新的SOTA(最先进水平),展示了人工智能推理效率的进步。
排序理由 该集群报告了一个人工智能系统的新基准成就,这是一个研究里程碑。
在 Mastodon — mastodon.social 阅读 →
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →