PulseAugur
实时 15:24:18
实体 GTOWizard

GTOWizard

PulseAugur coverage of GTOWizard — every cluster mentioning GTOWizard across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_58552 ·

    大型语言模型通过新的无训练框架实现专家级扑克水平

    研究人员开发了PokerSkill,这是一个新颖的框架,使大型语言模型(LLMs)无需进行游戏特定训练或复杂的求解器即可玩专家级扑克。该方法将大型语言模型与人类设计的扑克技能结构化库相结合,使模型能够将它们的行动建立在专家知识的基础上。在与GTOWizard基准进行测试时,使用PokerSkill的大型语言模型与基线模型相比,显著减少了损失,展示了与成熟的扑克机器人相媲美的性能。