研究人员开发了一种新的自监督生成模型,名为 Behavioral INR,它将隐式神经表征(INRs)应用于从无标签行为数据中学习策略表示。该模型通过将每个数据点视为潜在函数的样本,在无需监督的情况下推断策略身份,并能适应可变的片段长度和采样粒度。Behavioral INR 已在机器人、赛车和国际象棋等各种数据集上进行了评估,在策略可识别性方面显示出持续的改进,尤其是在复杂连续状态-动作设置中。 AI
影响 引入了一种新的无监督策略学习方法,有望推动强化学习和机器人技术的应用。
排序理由 该集群包含一篇详细介绍新模型及其评估的研究论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →