PulseAugur
实时 09:04:47
English(EN) OTora: A Unified Red Teaming Framework for Reasoning-Level Denial-of-Service in LLM Agents

新框架 OTora 测试 LLM 代理的推理级拒绝服务攻击

研究人员开发了 OTora,一个旨在测试大型语言模型 (LLM) 代理抵御一种称为推理级拒绝服务 (R-DoS) 的特定类型攻击的新型框架。这种攻击方法旨在通过人为增加代理的推理深度或工具使用来降低其性能,而不是导致任务完全失败。OTora 采用两阶段流程,利用对抗性触发器和遗传搜索来放大过度思考,同时保持任务准确性,并在各种代理基准测试中显示出显著的延迟增加。 AI

影响 这项研究揭示了 LLM 代理的新漏洞,可能影响已部署 AI 系统的可靠性和效率。

排序理由 该集群包含一篇研究论文,详细介绍了用于测试 LLM 代理安全性的新框架。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

报道来源 [1]

  1. arXiv cs.LG TIER_1 English(EN) · Xinyu Li, Ronghui Mu, Lin Li, Tianjin Huang, Gaojie Jin ·

    OTora:LLM Agent 推理级拒绝服务攻击的统一红队测试框架

    arXiv:2605.08876v2 Announce Type: replace Abstract: Large Language Models (LLMs) are increasingly deployed as autonomous agents that execute tool-augmented, multi-step tasks, where latency is a critical factor for real-world applications. Yet an overlooked threat is Reasoning-Lev…