实体
Behavioral Foundation Models
Behavioral Foundation Models
PulseAugur coverage of Behavioral Foundation Models — every cluster mentioning Behavioral Foundation Models across labs, papers, and developer communities, ranked by signal.
总计 · 30天
3
90 天内 3
发布 · 30天
0
90 天内 0
论文 · 30天
3
90 天内 3
层级分布 · 90 天
主题
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 3 条
-
新框架实现强化学习中的在线奖励发现
研究人员引入了一种新颖的强化学习零样本迁移框架,解决了在线奖励发现的挑战。所提出的方法利用行为基础模型(BFMs)来生成探索策略,将在线学习问题构建为类似赌博机的探索-利用任务。这种方法允许智能体通过与环境交互和观察奖励来学习最优策略,超越了需要预先存在的状态-奖励数据集的离线迁移方法的局限性。该论文推导了一个受上置信界(Upper Confidence Bound)启发的线性奖励近似公式,表明可以通过最小化不确定性矩阵的特征值来实现探索。
-
研究发现:行为基础模型需要更小的嵌入器
研究人员发布了一项关于行为基础模型规模法则的研究。这类模型在用户事件序列上进行训练,应用于推荐和欺诈检测等场景。研究发现,一个包含约2%参数的更小嵌入器在各种训练预算下都是计算最优的。最优训练策略在较低计算水平下倾向于更侧重数据,而在计算增加时则趋近于Chinchilla启发式。
-
Text2BFM 框架从文本生成长运动序列
研究人员推出 Text2BFM,一个从文本描述生成长而复杂的运动序列的新框架。与直接从语言生成运动的先前方法不同,Text2BFM 通过将自然语言与预训练的行为基础模型 (BFM) 对齐,将语义规划与运动执行分离开来。该方法利用变分瓶颈将 BFM 策略潜在变量压缩为与语言兼容的紧凑表示,从而实现高效、鲁棒的文本到运动生成,尤其适用于复杂或冗长的提示。