PulseAugur
实时 12:46:55
实体 Adversarial Concept Search

Adversarial Concept Search

PulseAugur coverage of Adversarial Concept Search — every cluster mentioning Adversarial Concept Search across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_91344 ·

    LLM故障预测方法使用表征几何学

    研究人员开发了一种名为对抗性概念搜索(Adversarial Concept Search)的新方法,用于预测大型语言模型(LLMs)在组合任务中何时会失败。通过分析LLM内部的表征几何学,该技术可以识别出被紧密编码在一起的概念组合,从而导致干扰和随后的错误。这种方法可以在无需测试特定输入的情况下预测故障模式,为实际LLM部署中的主动学习和有针对性的压力测试提供了可扩展的基础。