研究人员开发了Arbor,一个专为自主科学研究设计的新型AI框架。Arbor利用一个名为假设树精炼(HTR)的持久知识树来连接假设、证据和见解,从而实现跨长期项目的累积学习。在六项研究任务的评估中,Arbor的表现优于Codex和Claude Code,平均相对收益是它们的2.5倍以上,并在MLE-Bench Lite上使用GPT-5.5达到了86.36%的Any Medal。 AI
影响 Arbor的累积学习和自主优化方法有望加速跨各种AI相关领域的科学发现和发展。
排序理由 该集群描述了一个新的AI框架和一份详细介绍其能力及各项任务表现的研究论文。
在 Hugging Face Daily Papers 阅读 →
- Claude Code
- Codex
- GPT-5.5
- Hypothesis Tree Refinement (HTR)
- MLE-Bench Lite
- Hypothesis Tree Refinement
AI 生成摘要 · Google Gemini · 来自 4 个来源。 我们如何撰写摘要 →