研究人员开发了一种强化学习代理,能够实时优化大型强子对撞机(Large Hadron Collider)的触发阈值。该系统改编自Group-Filtered Policy Optimization (GFPO),旨在在遵守背景速率约束的同时最大化信号效率。在模拟数据上进行测试时,该代理将容差时间间隔提高了高达48%,并显示出2%的累积信号效率增益。至关重要的是,在没有进一步调整的情况下,同一代理在真实的CMS碰撞数据上取得了显著改进,标志着RL在这一环境中首次成功应用于触发控制。 AI
影响 展示了一种用AI优化复杂科学仪器的新方法,有望提高高能物理领域的数据收集效率。
排序理由 这是一篇详细介绍强化学习在科学仪器上新颖应用的学术论文。
AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →