PulseAugur
实时 08:58:10
(TL) Diagnosing Capability Gaps in Fine-Tuning Data

新框架GoalCover帮助检测LLM微调数据中的能力差距

研究人员推出了一种名为GoalCover的新框架,用于识别用于微调大型语言模型的数据集中的不足之处。该系统引导用户将高级目标分解为更小的子目标,然后根据这些子目标对训练样本进行评分。这个过程有助于在昂贵的微调开始之前找出缺失的能力,实验表明,当数据损坏时,目标能力会显著下降,这也证明了该框架的有效性。 AI

影响 通过在训练前识别和解决数据集差距,提供了一种提高LLM微调效率的方法。

排序理由 介绍用于诊断LLM微调数据集的新框架的学术论文。

在 arXiv cs.LG 阅读 →

AI 生成摘要 · Google Gemini · 来自 2 个来源。 我们如何撰写摘要 →

新框架GoalCover帮助检测LLM微调数据中的能力差距

报道来源 [2]

  1. arXiv cs.LG TIER_1 (TL) · Saeid Asgari Taghanaki, Rakshanda Agarwal, Bruce Sun, Rohan Jha, Elias Stengel-Eskin, Sara Malvar, Rui Ying, Yifei Xu, Guilherme Potje, Tusher Chakraborty, Leonardo de Oliveira Nunes, Ranveer Chandra, Emre Kiciman ·

    诊断微调数据中的能力差距

    arXiv:2604.27547v1 Announce Type: new Abstract: Fine-tuning large language models (LLMs) for domain-specific tasks requires training datasets that comprehensively cover the target capabilities a practitioner needs. Yet identifying which capabilities a dataset fails to support, an…

  2. arXiv cs.LG TIER_1 (TL) · Emre Kiciman ·

    诊断微调数据中的能力差距

    Fine-tuning large language models (LLMs) for domain-specific tasks requires training datasets that comprehensively cover the target capabilities a practitioner needs. Yet identifying which capabilities a dataset fails to support, and doing so before an expensive fine-tuning run, …