PulseAugur
实时 23:29:57
实体 Shir Rozenfeld

Shir Rozenfeld

PulseAugur coverage of Shir Rozenfeld — every cluster mentioning Shir Rozenfeld across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_11754 ·

    GAVEL框架通过激活监控引入基于规则的AI安全

    研究人员推出GAVEL,一个通过基于规则的激活监控来增强AI安全的新框架。该方法将LLM激活建模为可组合成特定规则的细粒度“认知元素”,提高了现有方法的精度和可解释性。GAVEL能够实时检测细微行为,并允许在不重新训练模型的情况下定制安全措施,从而提高AI治理的透明度和可审计性。该项目包括开源代码和一个名为GAVEL Studio的规则创作工具。