研究人员开发了一种新的行为基础模型(BFMs)方法,使其能够在无需测试时训练的情况下适应不断变化的环境动态。所提出的方法在前后(FB)表示框架内利用了基于Transformer的信念估计器。这种增强使得模型能够区分不同的动态并泛化到看不见的动态,在离散和连续任务中,零样本回报率比现有基线高出两倍。 AI
影响 增强了基础模型对现实世界动态环境的适应性,可能改进机器人技术和其他应用。
排序理由 关于行为基础模型适应新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →