PulseAugur
实时 12:49:14
English(EN) Creative Collision: Directorial Persona Steering and Competition in Large Language Models

大型语言模型受竞争性导演身份引导,斯皮尔伯格占主导地位

研究人员开发了一种名为“创意碰撞”的方法,通过两种对立的导演身份——史蒂文·斯皮尔伯格和马丁·斯科塞斯——来引导大型语言模型。通过在代表他们独特风格的向量之间进行插值,研究发现斯皮尔伯格的身份表现出方向性主导地位,在很大程度上压制了斯科塞斯的影响。有趣的是,中间碰撞点却悖论式地提高了生成连贯性,并且发现两种身份都最大程度地局限于Transformer模型中的特定层,这表明存在一个共享的“道德-语调基底”。 AI

影响 这项研究为控制大型语言模型的行为提供了新的见解,并可能带来更细致的创意生成。

排序理由 该集群包含一篇学术论文,详细介绍了一种引导大型语言模型的新颖方法。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Subramanyam Sahoo, Justin Shenk ·

    Creative Collision: Directorial Persona Steering and Competition in Large Language Models

    arXiv:2606.16240v1 Announce Type: new Abstract: Activation steering has emerged as a powerful tool for shaping the behaviour of large language models at inference time, yet most prior work injects a \emph{single} semantic direction into the residual stream. We study the richer se…

  2. arXiv cs.CL TIER_1 English(EN) · Justin Shenk ·

    Creative Collision: Directorial Persona Steering and Competition in Large Language Models

    Activation steering has emerged as a powerful tool for shaping the behaviour of large language models at inference time, yet most prior work injects a \emph{single} semantic direction into the residual stream. We study the richer setting in which two semantically opposing steerin…