实体
activation steering
activation steering
PulseAugur coverage of activation steering — every cluster mentioning activation steering across labs, papers, and developer communities, ranked by signal.
总计 · 30天
2
90 天内 2
发布 · 30天
0
90 天内 0
论文 · 30天
2
90 天内 2
层级分布 · 90 天
情绪 · 30 天
2 天有情绪数据
最近 · 第 1/1 页 · 共 2 条
-
新方法旨在提升大语言模型的文化意识和公平性
研究人员开发了两种不同的方法来提高大语言模型的文化意识。一种方法由 DFKI-MLT 用于 SemEval-2026 Task 7,通过使用语言向量的激活引导在推理时调整模型,在多项选择赛道上达到了 86.96% 的准确率。另一种方法称为跨语言共识,它使用多语言自洽性和自我批评,将潜在的文化知识从本地语言表示提取并传播到英文提示中,将 BLEnD 基准的性能平均提高了 5.03%。两项研究都强调了大语言模型中文化知识不均衡的挑战,并提…
-
Steering vectors offer direct control over LLM tone, bypassing prompt limitations
Prompt engineering is often ineffective for controlling the tone of large language models because behavioral traits are encoded in the model's internal state, not just its input prompts. A technique called activation st…