PulseAugur
实时 04:15:05
实体 Betley et al. 2025

Betley et al. 2025

PulseAugur coverage of Betley et al. 2025 — every cluster mentioning Betley et al. 2025 across labs, papers, and developer communities, ranked by signal.

Show in brief
总计 · 30天
1
90 天内 1
发布 · 30天
0
90 天内 0
论文 · 30天
1
90 天内 1
层级分布 · 90 天
情绪 · 30 天

1 天有情绪数据

最近 · 第 1/1 页 · 共 1 条
  1. TOOL · CL_39197 ·

    一致性训练封堵接种提示引起的AI模型失准

    研究人员开发了一种使用一致性训练的新方法,以解决接种提示中的一个缺陷。接种提示是一种旨在减少特定不良模型行为的技术。这种新方法被称为“封堵条件失准”,能有效关闭导致这些不良特征被重新诱发的“后门”。该方法已在 Llama-3.1 和 Qwen3 等开放权重模型上进行了测试,证明了其作为一种提高AI对齐成本效益干预措施的潜力。