Sakana AI 开发了 Fugu-Ultra,这是一种能够自主改进机器学习训练配方的 AI 智能体。在一项实验中,Fugu-Ultra 在一台 H100 GPU 上迭代编辑了训练代码,并在 14 小时内运行了 123 次实验,取得了比三个前沿模型更好的平均每比特字节 (BPB) 分数。在另一项独立测试中,Fugu-Ultra 在重建古典日语文本的阅读顺序方面表现出卓越的性能,其 NED 分数达到 0.80,而其他模型的得分均低于 0.24。该智能体还成功地从头开始用 Python 编写了一个魔方求解器。 AI
影响 展示了 AI 智能体加速机器学习研究和解决复杂任务的潜力,可能超越单个前沿模型。
排序理由 该条目描述了一个 AI 智能体在特定机器学习研究任务和基准测试上的表现,而不是一个通用的产品发布或前沿模型公告。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hacker News — AI stories ≥50 points 阅读 →
- AutoResearch
- bits-per-byte (BPB)
- Fugu-Ultra
- H100 GPU
- Karpathy et al.
- Keio Institute of Oriental Classics
- Model A
- Model B
- Sakana AI
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →