PulseAugur
实时 15:25:51
实体 distilgpt2

distilgpt2

PulseAugur coverage of distilgpt2 — every cluster mentioning distilgpt2 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
0
90 天内 0
层级分布 · 90 天
主题
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. RESEARCH · CL_88573 ·

    Google 的 AMS 工具在三个测试的 LLM 中发现关键安全缺陷

    Google Cloud 已开源 AMS(Activation Model Scanner),一个用于分析模型激活空间几何结构以验证安全训练的工具。与传统的行为测试不同,AMS 直接检查模型的权重是否存在安全对齐的证据。对三个开源模型(TinyLlama、distilgpt2 和 Qwen2.5-0.5B)的初步测试均得出“CRITICAL”评级,表明缺乏有效的安全训练或与安全基准存在显著偏差。