PulseAugur
实时 13:51:24
实体 TrojanTO

TrojanTO

PulseAugur coverage of TrojanTO — every cluster mentioning TrojanTO across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_58992 ·

    新的TrojanTO攻击针对强化学习中的轨迹优化模型

    研究人员开发了TrojanTO,这是一种针对离线强化学习中使用的轨迹优化(TO)模型执行动作级后门攻击的新颖方法。与之前的奖励操纵攻击不同,TrojanTO针对TO模型的序列建模特性,并解决了高维动作空间带来的挑战。该攻击通过交替训练增强触发器-动作连接,并通过轨迹过滤进行精确投毒以实现隐蔽性,在低投毒预算下实现了有效性。