PulseAugur
实时 13:52:20
实体 AMS (Activation Model Scanner)

AMS (Activation Model Scanner)

PulseAugur coverage of AMS (Activation Model Scanner) — every cluster mentioning AMS (Activation Model Scanner) across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
时间线
  1. 2026-06-13 product_launch Google Cloud released AMS, an open-source tool for verifying LLM safety training by analyzing activation space geometry. 来源
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_88573 ·

    Google 的 AMS 工具在三个测试的 LLM 中发现关键安全缺陷

    Google Cloud 已开源 AMS(Activation Model Scanner),一个用于分析模型激活空间几何结构以验证安全训练的工具。与传统的行为测试不同,AMS 直接检查模型的权重是否存在安全对齐的证据。对三个开源模型(TinyLlama、distilgpt2 和 Qwen2.5-0.5B)的初步测试均得出“CRITICAL”评级,表明缺乏有效的安全训练或与安全基准存在显著偏差。