PulseAugur
实时 16:33:12
English(EN) Context Training with Active Information Seeking

LLM学会主动检索外部信息以更好地适应任务

研究人员开发了一种新方法来适应大型语言模型(LLM),使其能够主动从维基百科和网络浏览器等外部来源检索信息。这种被称为“主动信息检索”的方法被整合到一个基于搜索的训练程序中,该程序可以维护和修剪候选上下文。该方法在翻译、健康场景和推理任务等各种领域都显示出显著的性能提升,同时被证明具有数据效率高且可泛化到不同模型的特点。 AI

影响 使LLM能够动态获取新知识,有可能提高它们在快速发展领域的效用。

排序理由 该集群包含一篇详细介绍LLM适应新方法的学术论文。

在 arXiv cs.CL 阅读 →

AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →

LLM学会主动检索外部信息以更好地适应任务

报道来源 [1]

  1. arXiv cs.CL TIER_1 English(EN) · Marc'Aurelio Ranzato ·

    主动信息检索的上下文训练

    Most existing large language models (LLMs) are expensive to adapt after deployment, especially when a task requires newly produced information or niche domain knowledge. Recent work has shown that, by manipulating and optimizing their context, LLMs can be tailored to downstream t…