研究人员开发了Curation-Bench,这是一个旨在测试通用AI智能体是否能够为AI开发自动化数据策展过程的新基准。在视觉-语言指令调优任务中,智能体展现了执行策展循环的能力,但在探索新的策略族方面遇到困难,反而专注于局部变化。当提供方法论指导和适应性脚手架时,智能体能够自主地组合出一种数据选择策略,该策略以显著更小的预算超越了现有基线,凸显了结构化适应而非简单提示的必要性。 AI
影响 展示了实现AI开发中关键、劳动密集型方面自动化的途径,可能加速模型训练并提高效率。
排序理由 学术论文,介绍了一个新的基准和方法论。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →