English(EN) TrojanTO: Action-Level Backdoor Attacks against Trajectory Optimization Models

新的TrojanTO攻击针对强化学习中的轨迹优化模型

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-29 04:00

研究人员开发了TrojanTO，这是一种针对离线强化学习中使用的轨迹优化（TO）模型执行动作级后门攻击的新颖方法。与之前的奖励操纵攻击不同，TrojanTO针对TO模型的序列建模特性，并解决了高维动作空间带来的挑战。该攻击通过交替训练增强触发器-动作连接，并通过轨迹过滤进行精确投毒以实现隐蔽性，在低投毒预算下实现了有效性。 AI

影响这项研究突显了轨迹优化模型潜在的安全漏洞，需要开发更强大的防御措施来应对复杂的后门攻击。

排序理由该集群包含一篇详细介绍针对AI模型的新颖攻击方法的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.LG TIER_1 English(EN) · Yang Dai, Oubo Ma, Longfei Zhang, Xingxing Liang, Xiaochun Cao, Shouling Ji, Jiaheng Zhang, Jincai Huang, Li Shen · 2026-05-29 04:00

TrojanTO：针对轨迹优化模型的动作级后门攻击

arXiv:2506.12815v2 Announce Type: replace Abstract: Recent advances in Trajectory Optimization (TO) models have achieved remarkable success in offline reinforcement learning. However, their vulnerabilities against backdoor attacks are poorly understood. We find that existing back…

报道来源 [1]

TrojanTO：针对轨迹优化模型的动作级后门攻击

相关实体

相关话题