English(EN) Prospect-Theory Behavior from Bellman Optimality in MDPs with Catastrophic States

AI研究将最优控制与期望理论行为联系起来

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

一篇新研究论文探讨了在马尔可夫决策过程（MDPs）中，最优控制如何能在没有明确的效用曲率或概率加权的情况下，内在地导致类似期望理论的行为。该研究发现，吸收性灾难状态的存在会导致智能体在增长情景下接近失败时表现出风险规避行为，而在衰退情景下表现出风险寻求行为。研究人员推导出了一个损失厌恶的封闭形式表达式，该表达式取决于获胜概率、收益不对称性和折扣因子，证明了吸收性失败状态是这些观察到行为的充分机制。 AI

影响识别出AI智能体中类似期望理论行为的结构化机制，可能影响关键系统中的风险感知决策。

排序理由该集群包含一篇在arXiv上发表的研究论文，详细介绍了AI领域的理论发现。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Yujiao Chen · 2026-06-02 04:00

具有灾难性状态的MDP中贝尔曼最优性产生的期望理论行为

arXiv:2606.00970v1 Announce Type: new Abstract: We study risk-neutral control in Markov decision processes with an absorbing catastrophic state. Even though rewards are linear and the agent has no utility curvature, probability weighting, or framing dependence, standard Bellman o…

报道来源 [1]

具有灾难性状态的MDP中贝尔曼最优性产生的期望理论行为

相关实体

相关话题