PulseAugur
实时 08:05:43
实体 generalist coding agents

generalist coding agents

PulseAugur coverage of generalist coding agents — every cluster mentioning generalist coding agents across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_86561 ·

    AI智能体可实现数据策展自动化,但需要结构化指导

    研究人员开发了Curation-Bench,一个旨在评估通用编程智能体自动化AI模型训练数据策展过程能力的新基准。初步测试表明,智能体可以在十次迭代内完成基本的数据选择,与现有基线相当。然而,智能体倾向于进行微小调整,而不是探索根本性的新数据策略家族。一种需要智能体引用和改编先前研究方法的脚手架式方法,促成了优越的数据选择策略的自主组合,该策略以显著更少的数据超越了已发布的基线。