English(EN) DexHoldem: Playing Texas Hold'em with Dexterous Embodied System

DexHoldem 基准测试具身 AI 在真实德州扑克中的表现

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-18 17:51

研究人员开发了 DexHoldem，这是一个用于评估具身 AI 系统在真实世界灵巧操作任务（特别是玩德州扑克）的新基准。该系统包括用于操作的 ShadowHand，一个包含 1,470 个演示的数据集，以及用于原始技能执行和代理感知的基准。初步测试显示不同模型的性能各异，Opus 4.7 在感知的严格问题级别准确性方面表现出色，而 GPT 5.5 在平均字段级别准确性方面领先，凸显了在闭环部署中将感知与策略相结合的挑战。 AI

影响引入了一个新的物理基准来评估具身 AI，推动了集成感知和操作系统的发展。

排序理由发布了一篇介绍具身 AI 系统新基准的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yi Ma · 2026-05-18 17:51

DexHoldem: Playing Texas Hold'em with Dexterous Embodied System

Evaluating embodied systems on real dexterous hardware requires more than isolated primitive skills: an agent must perceive a changing tabletop scene, choose a context-appropriate action, execute it with a dexterous hand, and leave the scene usable for later decisions. We introdu…

报道来源 [1]

DexHoldem: Playing Texas Hold'em with Dexterous Embodied System

相关实体

相关话题