研究人员推出了ATOM-Bench,这是一个新的真实世界基准,旨在评估机器人操作策略的原子技能和组合泛化能力。该基准包括30个原子任务和24个未包含的组合任务,利用3000个人类演示进行微调和评估。对五个代表性策略的初步测试显示,尽管当前模型可以掌握基本的指令理解,但在细粒度运动技能和可靠地组合所学技能以完成新任务方面存在困难。 AI
影响 该基准旨在提高机器人操作策略在现实世界中的泛化能力,解决了机器人AI的一个关键挑战。
排序理由 该集群描述了一个新的学术基准和在arXiv上发表的相关论文。
- ATOM-Bench
- Atomic Score
- Compositional Failure Share
- Hugging Face
- robotics
- alphaXiv
- CatalyzeX Code Finder for Papers
- CORE Recommender
- DagsHub
- Gotit.pub
- ScienceCast
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →