研究人员开发了一个新的框架来分析深度强化学习(DRL)系统中的对抗性输入。该框架引入了“对抗性率”指标,该指标改编自ProVe系列,用于量化和可视化DRL模型中的对抗性漏洞。目标是通过提供工具和指南来减轻这些输入扰动,从而提高DRL系统的可靠性,特别是在安全关键型应用中。 AI
影响 提供了一个新的指标和框架,以提高DRL系统在对抗性攻击下的安全性和可靠性。
排序理由 这是一篇发表在arXiv上的研究论文,详细介绍了一种用于分析DRL中对抗性输入的新指标和框架。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →