一篇新发表在arXiv上的研究调查了联合嵌入预测(JEPA)目标在机器学习中的局限性。研究表明,这些通过预测未来状态来学习表征的目标,可能会无意中丢弃与控制代理行为相关但外源(不可控)的特征。这是因为优化过程优先考虑时间可预测性而非控制相关性。研究提出,用奖励信号来约束JEPA目标可以有效地保留这些关键特征,即使只有一小部分标记数据。 AI
影响 这项研究指出了常见预测学习目标的一个潜在缺陷,表明代理需要奖励约束才能有效利用控制相关特征。
排序理由 该集群包含一篇详细阐述机器学习目标机制研究的论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →