English(EN) Context Training with Active Information Seeking

LLM学会主动检索外部信息以更好地适应任务

作者 PulseAugur 编辑部 · [1 个来源] · 2026-05-13 06:15

研究人员开发了一种新方法来适应大型语言模型（LLM），使其能够主动从维基百科和网络浏览器等外部来源检索信息。这种被称为“主动信息检索”的方法被整合到一个基于搜索的训练程序中，该程序可以维护和修剪候选上下文。该方法在翻译、健康场景和推理任务等各种领域都显示出显著的性能提升，同时被证明具有数据效率高且可泛化到不同模型的特点。 AI

影响使LLM能够动态获取新知识，有可能提高它们在快速发展领域的效用。

排序理由该集群包含一篇详细介绍LLM适应新方法的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。我们如何撰写摘要 →

报道来源 [1]

arXiv cs.CL TIER_1 English(EN) · Marc'Aurelio Ranzato · 2026-05-13 06:15

主动信息检索的上下文训练

Most existing large language models (LLMs) are expensive to adapt after deployment, especially when a task requires newly produced information or niche domain knowledge. Recent work has shown that, by manipulating and optimizing their context, LLMs can be tailored to downstream t…

报道来源 [1]

主动信息检索的上下文训练

相关实体

相关话题