PulseAugur
实时 18:50:20
实体 Huihui

Huihui

PulseAugur coverage of Huihui — every cluster mentioning Huihui across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
主题
情绪 · 30 天

2 天有情绪数据

最近 · 第 1/1 页 · 共 2 条
  1. TOOL · CL_68938 ·

    新的 Apostate 工具可“清除”LLM 安全训练,可与 Heretic 相媲美

    一款名为 Apostate 的新工具已被开发出来,用于“清除”大型语言模型中的安全训练。基准测试将其与 Heretic 和 Huihui 等现有工具进行了比较。虽然 Heretic 的表现略好,在参数改动极小的情况下实现了 100% 的拒绝移除成功率,但 Apostate 和 Huihui 也取得了 98% 的强劲表现。分析显示,这些工具在 Qwen 2.5 7B 模型中找到了不同的“拒绝方向”,表明安全训练并非只有一个失败点。

  2. TOOL · CL_61829 ·

    Gemma 4 E2B变体显示出改进的安全性和部分推理能力的提升

    对Google的Gemma 4 E2B模型的13个修改版本的全面分析显示,虽然所有变体都通过提高拒绝率显著提高了安全性,但其中一些也增强了推理能力。具体而言,coder3101和llmfan46这两个变体在GSM8K数学基准测试中表现优于基础模型。然而,更激进的修改导致语言建模性能和推理效率明显下降,一些变体显示出显著更高的困惑度(perplexity)和空响应。