PulseAugur
实时 08:24:08
English(EN) Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

新方法提升LLM跨语言事实回忆能力

研究人员开发了一种新方法,以提高大型语言模型在不同语言中回忆事实的能力。他们创建了一个名为PolyFact的数据集,包含12种语言的10万个事实,用于研究和解决跨语言事实不一致问题。他们的强化学习方法GRPO在提高事实回忆能力和泛化到新语言方面,显著优于标准的微调方法。 AI

影响 通过提高跨语言事实一致性,增强了LLM在多语言应用中的可靠性。

排序理由 该集群包含一篇学术论文,详细介绍了一种改进LLM性能的新方法和数据集。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

报道来源 [2]

  1. arXiv cs.CL TIER_1 English(EN) · Jonathan von Rad, Louis Arts, George Burgess, Eleftheria Kolokytha, Harry O'Donnell, Ektor Oikonomidis Doumpas, Eduardo Sanchez, Yao Lu, Pontus Stenetorp ·

    通过一致性驱动的强化学习改进跨语言事实回忆

    arXiv:2606.06586v1 Announce Type: new Abstract: Large language models (LLMs) trained predominantly on English data encode substantial world knowledge, yet often fail to express it reliably in other languages, a phenomenon known as cross-lingual factual inconsistency. To study and…

  2. arXiv cs.CL TIER_1 English(EN) · Pontus Stenetorp ·

    通过一致性驱动的强化学习改进跨语言事实回忆

    Large language models (LLMs) trained predominantly on English data encode substantial world knowledge, yet often fail to express it reliably in other languages, a phenomenon known as cross-lingual factual inconsistency. To study and address this, we introduce PolyFact, a large-sc…