研究人员开发了一个名为伙伴感知技能发现(PASD)的新框架,以改进人机协作。该方法通过将技能与伙伴行为而非仅代理中心奖励相关联,解决了现有分层强化学习的局限性。PASD使用对比内在奖励来识别伙伴交互中的模式,促进适应性协调并减轻捷径学习。在Overcooked-AI基准上的评估表明,PASD在将技能学习迁移到包括人类代理模型在内的各种伙伴行为方面,显著优于其他方法。 AI
影响 增强了AI与新颖的人类伙伴有效适应和协调的能力,这对于鲁棒的人机团队至关重要。
排序理由 详细介绍新AI框架及其评估的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →