PulseAugur
实时 13:52:26
实体 Pre-Ex-Bench

Pre-Ex-Bench

PulseAugur coverage of Pre-Ex-Bench — every cluster mentioning Pre-Ex-Bench across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_65326 ·

    新的TRACE方法提高了长时LLM代理的安全检测能力

    研究人员推出了一种新颖的TRACE方法,用于增强长时大型语言模型(LLM)代理的安全性。TRACE解决了传统回合级检测器常常忽略的稀疏和延迟安全风险的检测挑战。该系统采用压缩器-读取器(Compressor-Reader)设计,其中压缩器将整个轨迹编码为压缩的潜在状态,然后读取器使用该状态来评估安全性。这种方法有效地汇集了分散的风险线索,并防止了过早的证据丢失,在多个基准测试中表现优于现有方法。