研究人员开发了一个名为SCOUT的新框架,以提高大型语言模型(LLM)在非语言任务上的性能。SCOUT将探索与利用分离,使用轻量级的“侦察兵”从环境中高效收集数据。然后,这些数据用于微调LLM,使其在以前需要大量且昂贵试错的任务上表现更好。在实验中,SCOUT使Qwen2.5-3B-Instruct模型在消耗更少计算资源的情况下,超越了Gemini-2.5-Pro等专有模型。 AI
影响 该框架可能显著降低LLM在复杂现实世界任务训练中的计算成本。
排序理由 该集群包含一篇详细介绍新框架和实验结果的学术论文。[lever_c_demoted from research: ic=1 ai=1.0]
AI 生成摘要 · Google Gemini · 来自 1 个来源。 我们如何撰写摘要 →