PulseAugur
实时 23:28:45
实体 Schmidhuber

Schmidhuber

PulseAugur coverage of Schmidhuber — every cluster mentioning Schmidhuber across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_10179 ·

    Curiosity-Critic 奖励提高了世界模型训练的准确性

    研究人员引入了一种新颖的内在奖励机制,称为 Curiosity-Critic,用于训练世界模型。该方法将其奖励建立在世界模型累积预测误差的改进之上,提供了一个可处理的每步代理。学习到的 Critic 在线估计误差基线,将探索引导至可学习的转换,并区分可约和不可约的预测误差。实验表明,Curiosity-Critic 在训练速度和世界模型准确性方面均优于现有方法。