English(EN) A Negative Result on Cross-Model Activation Transfer in a Pythia Multi-Hop Setting

语言模型无法通过直接激活注入转移推理状态

作者 PulseAugur 编辑部 · [1 个来源] · 2026-06-03 04:00

研究人员调查了一个语言模型在推理过程中是否可以直接将其内部推理状态转移到另一个模型。虽然一个线性转换层成功地将高相似度 Pythia 模型之间的隐藏状态映射起来，但注入这些转换后的激活并没有提高接收模型的性能。研究发现，低强度加性注入和替换式注入均无效，这表明在这种特定设置下，离线表示对齐本身不足以实现模型之间的因果通信。 AI

影响展示了模型间直接通信的局限性，表明当前转移学习到的推理的方法不足。

排序理由该集群包含一篇详细介绍实验结果的研究论文。[lever_c_demoted from research: ic=1 ai=1.0]

在 arXiv cs.AI 阅读 →

arXiv
Pythia

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.AI TIER_1 English(EN) · Peiyan Zhang · 2026-06-03 04:00

Pythia多跳设置中跨模型激活迁移的负面结果

arXiv:2606.03280v1 Announce Type: new Abstract: Recent work shows that language models can transmit behavioural traits through hidden signals in generated data during training. We ask whether a more direct and stricter channel is also viable: can one language model communicate us…

报道来源 [1]

Pythia多跳设置中跨模型激活迁移的负面结果

相关实体

相关话题