English(EN) Interaction-Limited Safe Continuous-Time RL for Dynamical Medical Treatment

新的强化学习框架通过自适应交互时机优化医疗治疗

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-02 04:00

研究人员开发了一个名为交互受限安全连续时间强化学习（Interaction-Limited Safe Continuous-Time Reinforcement Learning）的新框架，用于优化医疗治疗策略。该方法解决了临床交互之间患者状态的持续演变和潜在不良事件的挑战。通过将问题重新表述为半马尔可夫决策过程，该框架在强制执行轨迹级安全约束的同时，联合优化治疗给药和临床交互的时机。实验表明，与传统的等距交互方案相比，这种自适应交互时机机制提高了安全性和治疗效果。 AI

影响引入了一种新颖的强化学习框架，用于更安全、更有效的动态医疗治疗优化。

排序理由该集群包含一篇详细介绍新方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Xun Shen, Yuepeng Wang, Akifumi Wachi, Yongqi Zhou, Richard Weiss, Yoshihiko Fujisawa, Ken Kawano, Mehrshad Sadria, Ying Chen, Xin Liu, Sebastien Gros, Xiao Hu, Kyoung-Sook Kim, Mengmou Li, Katsuki Fujisawa, Kenji Wakabayashi · 2026-06-02 04:00

Interaction-Limited Safe Continuous-Time RL for Dynamical Medical Treatment

arXiv:2606.01051v1 Announce Type: new Abstract: Dynamic medical treatment requires deciding treatment intensity and intervention timing, while patient states evolve continuously and adverse events may occur between clinical interactions. Most existing treatment learning methods a…

报道来源 [1]

Interaction-Limited Safe Continuous-Time RL for Dynamical Medical Treatment

相关实体

相关话题