研究人员开发了一个新的框架,用于合成部分可观察马尔可夫决策过程(POMDP)的策略,POMDP用于不确定性下的决策。该方法结合了可扩展但缺乏正式保证的基于采样的方法,以及提供正确性但难以扩展的形式化综合技术。通过使用采样作为成员预言机和模型检测作为等价预言机,该框架可以合成具有正式保证的有限状态控制器,在安全关键型应用中显示出潜力。 AI
影响 这项研究提供了一种不确定性下决策的新方法,通过结合可扩展性和正式保证,有可能提高关键应用的安全性。
排序理由 该集群描述了一篇关于POMDP策略新合成框架的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
在 Hugging Face Daily Papers 阅读 →
- Angluin's $L^*$ algorithm
- formal synthesis techniques
- Partially Observable Markov Decision Processes
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →