PulseAugur
实时 18:28:55
English(EN) Code-Switching Reveals Language Anchoring in Multilingual LLMs

新的CANVAS方法提高了多语言大型语言模型代码转换的性能

研究人员开发了一种名为CANVAS的新方法,以提高多语言大型语言模型(MLLMs)在处理代码转换输入时的性能。通过分析“锚定偏差”(一种衡量模型内部状态与源语言或目标语言对齐程度的指标),他们识别出一种持续的语法框架效应,该效应会降低问答性能。CANVAS是一种推理时干预方法,它将目标语言的隐藏状态引导至源锚定,从而在各种MLLMs和代码转换条件下持续恢复问答F1分数。 AI

影响 这项研究提供了一种新颖的方法来增强多语言大型语言模型在处理代码转换输入时的鲁棒性,有可能提高它们在不同语言环境中的可用性。

排序理由 该集群包含一篇学术论文,详细介绍了一种新方法和指标,用于提高大型语言模型的性能。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新的CANVAS方法提高了多语言大型语言模型代码转换的性能

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Jeonghyun Park, Seunghyun Yoon, Yonghyun Jun, Hwanhee Lee ·

    Code-Switching Reveals Language Anchoring in Multilingual LLMs

    arXiv:2606.19668v1 Announce Type: new Abstract: Multilingual Large Language Models (MLLMs) are increasingly expected to handle Code-Switched (CS) inputs, yet mixing languages frequently degrades performance relative to source- or target-language monolingual counterparts. To under…

  2. arXiv cs.CL TIER_1 English(EN) · Hwanhee Lee ·

    代码转换揭示多语言大模型中的语言锚定

    Multilingual Large Language Models (MLLMs) are increasingly expected to handle Code-Switched (CS) inputs, yet mixing languages frequently degrades performance relative to source- or target-language monolingual counterparts. To understand this degradation, we use grammar-forced CS…