PulseAugur
实时 13:56:56
实体 Bellman optimality

Bellman optimality

PulseAugur coverage of Bellman optimality — every cluster mentioning Bellman optimality across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_65340 ·

    AI研究将最优控制与期望理论行为联系起来

    一篇新研究论文探讨了在马尔可夫决策过程(MDPs)中,最优控制如何能在没有明确的效用曲率或概率加权的情况下,内在地导致类似期望理论的行为。该研究发现,吸收性灾难状态的存在会导致智能体在增长情景下接近失败时表现出风险规避行为,而在衰退情景下表现出风险寻求行为。研究人员推导出了一个损失厌恶的封闭形式表达式,该表达式取决于获胜概率、收益不对称性和折扣因子,证明了吸收性失败状态是这些观察到行为的充分机制。