PulseAugur
实时 09:26:09
实体 ATOM-Bench

ATOM-Bench

PulseAugur coverage of ATOM-Bench — every cluster mentioning ATOM-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_93395 ·

    新的ATOM-Bench基准测试机器人操作的泛化能力

    研究人员推出了ATOM-Bench,这是一个新的真实世界基准,旨在评估机器人操作策略的原子技能和组合泛化能力。该基准包括30个原子任务和24个未包含的组合任务,利用3000个人类演示进行微调和评估。对五个代表性策略的初步测试显示,尽管当前模型可以掌握基本的指令理解,但在细粒度运动技能和可靠地组合所学技能以完成新任务方面存在困难。