PulseAugur
实时 05:14:29
实体 RAS-Eval

RAS-Eval

PulseAugur coverage of RAS-Eval — every cluster mentioning RAS-Eval across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_48829 ·

    LLM Agent 工具调用流量检测框架采用图神经网络

    研究人员开发了一个新颖的框架,用于检测大型语言模型 (LLM) Agent 的工具调用流量中的攻击。该系统将 Agent 会话表示为图,并结合工具参数和响应的句子嵌入特征来将流量分类为良性或恶意。研究发现,内容级特征对于有效检测至关重要,其性能显著优于仅使用元数据的方​​法,并指出了一个可能夸大性能指标的常见评估陷阱。