实体 Behavioral Foundation Models

Behavioral Foundation Models

PulseAugur coverage of Behavioral Foundation Models — every cluster mentioning Behavioral Foundation Models across labs, papers, and developer communities, ranked by signal.

Show in brief

总计 · 30天

90 天内 3

发布 · 30天

90 天内 0

论文 · 30天

90 天内 3

层级分布 · 90 天

主题

情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 3 条

TOOL · CL_117501 · Jun 30 · 04:00

新框架实现强化学习中的在线奖励发现

研究人员引入了一种新颖的强化学习零样本迁移框架，解决了在线奖励发现的挑战。所提出的方法利用行为基础模型（BFMs）来生成探索策略，将在线学习问题构建为类似赌博机的探索-利用任务。这种方法允许智能体通过与环境交互和观察奖励来学习最优策略，超越了需要预先存在的状态-奖励数据集的离线迁移方法的局限性。该论文推导了一个受上置信界（Upper Confidence Bound）启发的线性奖励近似公式，表明可以通过最小化不确定性矩阵的特征值来实现探索。
RESEARCH · CL_72409 · Jun 3 · 15:59

研究发现：行为基础模型需要更小的嵌入器

研究人员发布了一项关于行为基础模型规模法则的研究。这类模型在用户事件序列上进行训练，应用于推荐和欺诈检测等场景。研究发现，一个包含约2%参数的更小嵌入器在各种训练预算下都是计算最优的。最优训练策略在较低计算水平下倾向于更侧重数据，而在计算增加时则趋近于Chinchilla启发式。
TOOL · CL_58931 · May 29 · 04:00

Text2BFM 框架从文本生成长运动序列

研究人员推出 Text2BFM，一个从文本描述生成长而复杂的运动序列的新框架。与直接从语言生成运动的先前方法不同，Text2BFM 通过将自然语言与预训练的行为基础模型 (BFM) 对齐，将语义规划与运动执行分离开来。该方法利用变分瓶颈将 BFM 策略潜在变量压缩为与语言兼容的紧凑表示，从而实现高效、鲁棒的文本到运动生成，尤其适用于复杂或冗长的提示。

新框架实现强化学习中的在线奖励发现

研究发现：行为基础模型需要更小的嵌入器

Text2BFM 框架从文本生成长运动序列